Mistral: مدل زبانی هوش مصنوعی پیشرفته با ۶۷۱ میلیارد پارامتر
کارایی انقلابی نسل بعدی مدلهای زبانی را در استدلال، برنامهنویسی و محاسبات ریاضی تجربه کنید
ادغام رایگان در وبسایت
آیا وبسایت دارید؟ رابط گفتگوی ما را با یک کد iframe ساده به صورت رایگان در سایت خود جاسازی کنید. نیازی به ثبتنام نیست.
چت Mistral را بدون ثبتنام امتحان کنید
ویژگیهای کلیدی
قابلیتهای قدرتمندی که Mistral را متمایز میکند را کشف کنید
معماری پیشرفته MoE
مدل انقلابی با ۶۷۱ میلیارد پارامتر که تنها ۳۷ میلیارد پارامتر برای هر توکن فعال میشود، با متعادلسازی بار نوآورانه به کارایی بهینه دست مییابد
- •توجه نهان چندسر (MLA)
- •متعادلسازی بار بدون تلفات کمکی
- •معماری MistralMoE
- •هدف پیشبینی چند توکنی
عملکرد پیشرو
نتایج استثنایی در معیارهای مختلف از جمله MMLU (۸۷.۱٪)، BBH (۸۷.۵٪) و وظایف استدلال ریاضی
- •امتیازات برتر در مسابقات برنامهنویسی
- •محاسبات ریاضی پیشرفته
- •قابلیتهای چندزبانه
- •وظایف استدلال پیچیده
آموزش کارآمد
رویکرد آموزشی پیشگامانه که تنها به ۲.۷۸۸ میلیون ساعت GPU H800 نیاز دارد، با کارایی هزینه قابل توجه ۵.۵ میلیون دلار
- •آموزش دقت ترکیبی FP8
- •چارچوب آموزشی بهینهشده
- •فرآیند آموزش پایدار
- •بدون نیاز به بازگشت
استقرار انعطافپذیر
گزینههای متعدد استقرار با پشتیبانی از GPUهای NVIDIA، AMD و NPUهای Huawei Ascend برای یکپارچهسازی انعطافپذیر
- •آماده استقرار در ابر
- •پشتیبانی از استنتاج محلی
- •پلتفرمهای سختافزاری متعدد
- •گزینههای سرویسدهی بهینه
قابلیتهای پیشرفته کدنویسی
عملکرد برتر در وظایف برنامهنویسی، برتری در مسابقات برنامهنویسی و سناریوهای توسعه دنیای واقعی
- •پشتیبانی از چند زبان
- •تکمیل کد
- •تشخیص خطا
- •بهینهسازی کد
امنیت سازمانی
اقدامات امنیتی جامع و ویژگیهای انطباق برای استقرار و یکپارچهسازی سازمانی
- •کنترل دسترسی
- •رمزگذاری داده
- •ثبت ممیزی
- •آماده انطباق
دادههای آموزشی گسترده
پیشآموزش روی ۱۴.۸ تریلیون توکن متنوع و با کیفیت بالا، تضمینکننده دانش و قابلیتهای گسترده
- •منابع داده متنوع
- •محتوای فیلترشده با کیفیت
- •حوزههای متعدد
- •بهروزرسانیهای منظم
رهبری نوآوری
پیشگامی در پیشرفتهای فناوری هوش مصنوعی از طریق همکاری باز و نوآوری مستمر
- •رهبری پژوهش
- •همکاری باز
- •هدایت توسط جامعه
- •بهبودهای منظم
Mistral در پوشش رسانهای
پیشرفت جدید در توسعه هوش مصنوعی متنباز
عملکرد پیشگامانه
Mistral از مدلهای هوش مصنوعی متنباز و بسته در مسابقات برنامهنویسی پیشی گرفته است، به ویژه در مسابقات Codeforces و آزمون Aider Polyglot.
معماری مقیاس بزرگ
با ۶۷۱ میلیارد پارامتر و آموزش روی ۱۴.۸ تریلیون توکن، ۱.۶ برابر بزرگتر از Llama 3.1 405B متا است.
هزینه توسعه کارآمد
آموزش تنها در دو ماه با استفاده از GPUهای Nvidia H800 تکمیل شد، با هزینه توسعه تنها ۵.۵ میلیون دلار.
نمایش عملی Mistral
ببینید چگونه Mistral قابلیتهای هوش مصنوعی متنباز را متحول میکند
Mistral: هوش مصنوعی متنباز انقلابی
درک عمیقتری از قابلیتهای Mistral و مقایسه عملکرد آن با سایر مدلهای پیشرو هوش مصنوعی کسب کنید.
معیارهای عملکرد Mistral
درک زبان Mistral
برنامهنویسی Mistral
ریاضیات Mistral
مشخصات فنی
کاوش در قابلیتها و معماری فنی پیشرفته که Mistral را پشتیبانی میکند
جزئیات معماری Mistral
معماری شبکه عصبی پیشرفته طراحی شده برای بهترین عملکرد و کارایی
پژوهش Mistral
پیشبرد مرزهای قابلیتهای مدل زبانی
معماری نوین
معماری نوآورانه Mixture-of-Experts (MoE) با استراتژی متعادلسازی بار بدون نیاز به تابع خطای کمکی
روششناسی آموزش
چارچوب پیشرفته آموزش FP8 با دقت ترکیبی اعتبارسنجی شده در آموزش مدلهای مقیاس بزرگ
مقاله فنی
مقاله فنی جامع ما را مطالعه کنید که جزئیات معماری، فرآیند آموزش و نتایج ارزیابی Mistral را شرح میدهد.
مطالعه مقالهدرباره Mistral
پیشگامی در آینده توسعه هوش مصنوعی متنباز
پیشینه شرکت
Mistral با پشتیبانی Hillhouse Capital، متعهد به دستیابی به پیشرفتهای پیشگامانه در فناوری هوش مصنوعی از طریق همکاری و نوآوری باز است.
زیرساخت
Mistral دارای خوشههای محاسباتی پیشرفته شامل ۱۰,۰۰۰ GPU Nvidia A100 است که توانایی برجستهای در آموزش مدلهای مقیاس بزرگ نشان میدهد.
دانلود مدلهای Mistral
بین نسخههای پایه و بهینهشده برای چت Mistral انتخاب کنید
مدل پایه Mistral
مدل پایه با ۶۷۱ میلیارد پارامتر (۳۷ میلیارد فعال)
- •پیشآموزش روی ۱۴�۸ تریلیون توکن
- •طول زمینه ۱۲۸ هزار
- •وزنهای FP۸
- •۶۷۱ میلیارد پارامتر کل
مدل چت Mistral
مدل بهینهشده برای گفتگو و تعامل
- •استدلال پیشرفته
- •طول زمینه ۱۲۸ هزار
- •پیروی بهبود یافته از دستورات
- •۶۷۱ میلیارد پارامتر کل
دستورالعملهای نصب
دانلود با استفاده از Git LFS (روش توصیه شده):
# For Base Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3-Base
# For Chat Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3
گزینههای استقرار Mistral
استقرار محلی Mistral
اجرا در محل با Mistral-Infer Demo، با پشتیبانی از استنتاج FP8 و BF16
- راهاندازی ساده
- نسخه نمایشی سبک
- گزینههای دقت چندگانه
یکپارچهسازی ابری Mistral
استقرار در پلتفرمهای ابری با پشتیبانی SGLang و LMDeploy
- استقرار بومی ابر
- زیرساخت مقیاسپذیر
- آماده سازمانی
پشتیبانی سختافزاری Mistral
سازگار با GPUهای NVIDIA، AMD و NPUهای Huawei Ascend
- پشتیبانی چند فروشنده
- بهینهسازی عملکرد
- استقرار انعطافپذیر
نحوه استفاده از Mistral
در سه مرحله ساده، گفتگو با Mistral را آغاز کنید
بازدید از صفحه چت
روی دکمه "امتحان چت" در بالای صفحه کلیک کنید تا وارد رابط چت شوید
نوشتن سؤال
سؤال خود را در کادر ورودی چت بنویسید
منتظر پاسخ بمانید
Mistral به سرعت پاسخی تولید میکند، معمولاً فقط چند ثانیه طول میکشد
سؤالات متداول
اطلاعات بیشتر درباره Mistral
چه چیزی Mistral را منحصر به فرد میکند؟
Mistral از معماری MoE با ۶۷۱ میلیارد پارامتر استفاده میکند و با ویژگیهای نوآورانه مانند پیشبینی چند توکنی و متعادلسازی بار بدون تلفات کمکی، عملکرد برجستهای در انواع وظایف نشان میدهد.
چگونه میتوانم به Mistral دسترسی پیدا کنم؟
شما میتوانید از طریق پلتفرم نمایشی آنلاین و سرویس API ما به Mistral دسترسی پیدا کنید، یا وزنهای مدل را برای استقرار محلی دانلود کنید.
Mistral در چه وظایفی عملکرد برجسته دارد؟
Mistral در وظایف ریاضی، برنامهنویسی، استدلال و چندزبانه عملکرد عالی دارد و به طور مداوم نتایج برتر در ارزیابیهای معیار کسب میکند.
الزامات سختافزاری برای اجرای Mistral چیست؟
Mistral گزینههای متعدد استقرار را پشتیبانی میکند، از جمله GPUهای NVIDIA، AMD و NPUهای Huawei Ascend، و چارچوبهای متعددی را برای عملکرد بهینه ارائه میدهد.
آیا Mistral برای استفاده تجاری مجاز است؟
بله، Mistral برای استفاده تجاری مجاز است. برای شرایط خاص استفاده، لطفاً به توافقنامه مجوز مدل مراجعه کنید.
Mistral در مقایسه با سایر مدلهای زبانی چگونه است؟
Mistral در تمام معیارهای ارزیابی از سایر مدلهای متنباز برتر است و به سطح عملکرد مشابه با مدلهای بسته پیشرو دست یافته است.
Mistral از چه چارچوبهای استقراری پشتیبانی میکند؟
Mistral را میتوان با چارچوبهای متعددی مستقر کرد، از جمله SGLang، LMDeploy، TensorRT-LLM، vLLM و غیره، و از حالتهای استنتاج FP8 و BF16 پشتیبانی میکند.
اندازه پنجره زمینه Mistral چقدر است؟
Mistral دارای پنجره زمینه ۱۲۸K است که امکان پردازش و درک مؤثر وظایف پیچیده و محتوای متنی طولانی را فراهم میکند.
شروع کار با Mistral
امتحان API دیپسیک V3
دسترسی به قابلیتهای Mistral از طریق پلتفرم API مناسب برای توسعهدهندگان
شروع توسعه