Mistral

Mistral: مدل زبانی هوش مصنوعی پیشرفته با ۶۷۱ میلیارد پارامتر

کارایی انقلابی نسل بعدی مدل‌های زبانی را در استدلال، برنامه‌نویسی و محاسبات ریاضی تجربه کنید

۶۷۱ میلیارد پارامتر
برنامه‌نویسی پیشرفته
آموزش کارآمد

ادغام رایگان در وب‌سایت

آیا وب‌سایت دارید؟ رابط گفتگوی ما را با یک کد iframe ساده به صورت رایگان در سایت خود جاسازی کنید. نیازی به ثبت‌نام نیست.

<iframe src="https://www.chatmistral.org/embed" width="100%" height="600px" frameborder="0"></iframe>

چت Mistral را بدون ثبت‌نام امتحان کنید

ویژگی‌های کلیدی

قابلیت‌های قدرتمندی که Mistral را متمایز می‌کند را کشف کنید

معماری پیشرفته MoE

مدل انقلابی با ۶۷۱ میلیارد پارامتر که تنها ۳۷ میلیارد پارامتر برای هر توکن فعال می‌شود، با متعادل‌سازی بار نوآورانه به کارایی بهینه دست می‌یابد

  • توجه نهان چندسر (MLA)
  • متعادل‌سازی بار بدون تلفات کمکی
  • معماری MistralMoE
  • هدف پیش‌بینی چند توکنی

عملکرد پیشرو

نتایج استثنایی در معیارهای مختلف از جمله MMLU (۸۷.۱٪)، BBH (۸۷.۵٪) و وظایف استدلال ریاضی

  • امتیازات برتر در مسابقات برنامه‌نویسی
  • محاسبات ریاضی پیشرفته
  • قابلیت‌های چندزبانه
  • وظایف استدلال پیچیده

آموزش کارآمد

رویکرد آموزشی پیشگامانه که تنها به ۲.۷۸۸ میلیون ساعت GPU H800 نیاز دارد، با کارایی هزینه قابل توجه ۵.۵ میلیون دلار

  • آموزش دقت ترکیبی FP8
  • چارچوب آموزشی بهینه‌شده
  • فرآیند آموزش پایدار
  • بدون نیاز به بازگشت

استقرار انعطاف‌پذیر

گزینه‌های متعدد استقرار با پشتیبانی از GPUهای NVIDIA، AMD و NPUهای Huawei Ascend برای یکپارچه‌سازی انعطاف‌پذیر

  • آماده استقرار در ابر
  • پشتیبانی از استنتاج محلی
  • پلتفرم‌های سخت‌افزاری متعدد
  • گزینه‌های سرویس‌دهی بهینه

قابلیت‌های پیشرفته کدنویسی

عملکرد برتر در وظایف برنامه‌نویسی، برتری در مسابقات برنامه‌نویسی و سناریوهای توسعه دنیای واقعی

  • پشتیبانی از چند زبان
  • تکمیل کد
  • تشخیص خطا
  • بهینه‌سازی کد

امنیت سازمانی

اقدامات امنیتی جامع و ویژگی‌های انطباق برای استقرار و یکپارچه‌سازی سازمانی

  • کنترل دسترسی
  • رمزگذاری داده
  • ثبت ممیزی
  • آماده انطباق

داده‌های آموزشی گسترده

پیش‌آموزش روی ۱۴.۸ تریلیون توکن متنوع و با کیفیت بالا، تضمین‌کننده دانش و قابلیت‌های گسترده

  • منابع داده متنوع
  • محتوای فیلترشده با کیفیت
  • حوزه‌های متعدد
  • به‌روزرسانی‌های منظم

رهبری نوآوری

پیشگامی در پیشرفت‌های فناوری هوش مصنوعی از طریق همکاری باز و نوآوری مستمر

  • رهبری پژوهش
  • همکاری باز
  • هدایت توسط جامعه
  • بهبودهای منظم

Mistral در پوشش رسانه‌ای

پیشرفت جدید در توسعه هوش مصنوعی متن‌باز

عملکرد پیشگامانه

Mistral از مدل‌های هوش مصنوعی متن‌باز و بسته در مسابقات برنامه‌نویسی پیشی گرفته است، به ویژه در مسابقات Codeforces و آزمون Aider Polyglot.

معماری مقیاس بزرگ

با ۶۷۱ میلیارد پارامتر و آموزش روی ۱۴.۸ تریلیون توکن، ۱.۶ برابر بزرگتر از Llama 3.1 405B متا است.

هزینه توسعه کارآمد

آموزش تنها در دو ماه با استفاده از GPUهای Nvidia H800 تکمیل شد، با هزینه توسعه تنها ۵.۵ میلیون دلار.

نمایش عملی Mistral

ببینید چگونه Mistral قابلیت‌های هوش مصنوعی متن‌باز را متحول می‌کند

Mistral: هوش مصنوعی متن‌باز انقلابی

درک عمیق‌تری از قابلیت‌های Mistral و مقایسه عملکرد آن با سایر مدل‌های پیشرو هوش مصنوعی کسب کنید.

معیارهای عملکرد Mistral

درک زبان Mistral

MMLU87.1%
BBH87.5%
DROP89.0%

برنامه‌نویسی Mistral

HumanEval65.2%
MBPP75.4%
CRUXEval68.5%

ریاضیات Mistral

GSM8K89.3%
MATH61.6%
CMath90.7%

مشخصات فنی

کاوش در قابلیت‌ها و معماری فنی پیشرفته که Mistral را پشتیبانی می‌کند

جزئیات معماری Mistral

معماری شبکه عصبی پیشرفته طراحی شده برای بهترین عملکرد و کارایی

۶۷۱ میلیارد پارامتر کل، با فعال‌سازی پویای ۳۷ میلیارد پارامتر برای هر توکن
مکانیزم توجه نهان چندسر (MLA) برای بهبود درک زمینه
معماری MistralMoE با شبکه‌های متخصص
متعادل‌سازی بار بدون تلفات کمکی برای استفاده بهینه از منابع
هدف آموزشی پیش‌بینی چند توکنی برای افزایش کارایی
مکانیزم دروازه‌بندی تُنُک نوآورانه
تکنیک‌های پیشرفته اشتراک پارامتر
سیستم مدیریت حافظه بهینه‌شده

پژوهش Mistral

پیشبرد مرزهای قابلیت‌های مدل زبانی

معماری نوین

معماری نوآورانه Mixture-of-Experts (MoE) با استراتژی متعادل‌سازی بار بدون نیاز به تابع خطای کمکی

روش‌شناسی آموزش

چارچوب پیشرفته آموزش FP8 با دقت ترکیبی اعتبارسنجی شده در آموزش مدل‌های مقیاس بزرگ

مقاله فنی

مقاله فنی جامع ما را مطالعه کنید که جزئیات معماری، فرآیند آموزش و نتایج ارزیابی Mistral را شرح می‌دهد.

مطالعه مقاله

درباره Mistral

پیشگامی در آینده توسعه هوش مصنوعی متن‌باز

پیشینه شرکت

Mistral با پشتیبانی Hillhouse Capital، متعهد به دستیابی به پیشرفت‌های پیشگامانه در فناوری هوش مصنوعی از طریق همکاری و نوآوری باز است.

زیرساخت

Mistral دارای خوشه‌های محاسباتی پیشرفته شامل ۱۰,۰۰۰ GPU Nvidia A100 است که توانایی برجسته‌ای در آموزش مدل‌های مقیاس بزرگ نشان می‌دهد.

دانلود مدل‌های Mistral

بین نسخه‌های پایه و بهینه‌شده برای چت Mistral انتخاب کنید

مدل پایه Mistral

مدل پایه با ۶۷۱ میلیارد پارامتر (۳۷ میلیارد فعال)

حجم: ۶۸۵ گیگابایت
  • پیش‌آموزش روی ۱۴�۸ تریلیون توکن
  • طول زمینه ۱۲۸ هزار
  • وزن‌های FP۸
  • ۶۷۱ میلیارد پارامتر کل
دانلود مدل پایه

مدل چت Mistral

مدل بهینه‌شده برای گفتگو و تعامل

حجم: ۶۸۵ گیگابایت
  • استدلال پیشرفته
  • طول زمینه ۱۲۸ هزار
  • پیروی بهبود یافته از دستورات
  • ۶۷۱ میلیارد پارامتر کل
دانلود مدل چت

دستورالعمل‌های نصب

دانلود با استفاده از Git LFS (روش توصیه شده):

# For Base Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3-Base

# For Chat Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3

گزینه‌های استقرار Mistral

استقرار محلی Mistral

اجرا در محل با Mistral-Infer Demo، با پشتیبانی از استنتاج FP8 و BF16

  • راه‌اندازی ساده
  • نسخه نمایشی سبک
  • گزینه‌های دقت چندگانه

یکپارچه‌سازی ابری Mistral

استقرار در پلتفرم‌های ابری با پشتیبانی SGLang و LMDeploy

  • استقرار بومی ابر
  • زیرساخت مقیاس‌پذیر
  • آماده سازمانی

پشتیبانی سخت‌افزاری Mistral

سازگار با GPUهای NVIDIA، AMD و NPUهای Huawei Ascend

  • پشتیبانی چند فروشنده
  • بهینه‌سازی عملکرد
  • استقرار انعطاف‌پذیر

نحوه استفاده از Mistral

در سه مرحله ساده، گفتگو با Mistral را آغاز کنید

مرحله 1

بازدید از صفحه چت

روی دکمه "امتحان چت" در بالای صفحه کلیک کنید تا وارد رابط چت شوید

مرحله 2

نوشتن سؤال

سؤال خود را در کادر ورودی چت بنویسید

مرحله 3

منتظر پاسخ بمانید

Mistral به سرعت پاسخی تولید می‌کند، معمولاً فقط چند ثانیه طول می‌کشد

سؤالات متداول

اطلاعات بیشتر درباره Mistral

چه چیزی Mistral را منحصر به فرد می‌کند؟

Mistral از معماری MoE با ۶۷۱ میلیارد پارامتر استفاده می‌کند و با ویژگی‌های نوآورانه مانند پیش‌بینی چند توکنی و متعادل‌سازی بار بدون تلفات کمکی، عملکرد برجسته‌ای در انواع وظایف نشان می‌دهد.

چگونه می‌توانم به Mistral دسترسی پیدا کنم؟

شما می‌توانید از طریق پلتفرم نمایشی آنلاین و سرویس API ما به Mistral دسترسی پیدا کنید، یا وزن‌های مدل را برای استقرار محلی دانلود کنید.

Mistral در چه وظایفی عملکرد برجسته دارد؟

Mistral در وظایف ریاضی، برنامه‌نویسی، استدلال و چندزبانه عملکرد عالی دارد و به طور مداوم نتایج برتر در ارزیابی‌های معیار کسب می‌کند.

الزامات سخت‌افزاری برای اجرای Mistral چیست؟

Mistral گزینه‌های متعدد استقرار را پشتیبانی می‌کند، از جمله GPUهای NVIDIA، AMD و NPUهای Huawei Ascend، و چارچوب‌های متعددی را برای عملکرد بهینه ارائه می‌دهد.

آیا Mistral برای استفاده تجاری مجاز است؟

بله، Mistral برای استفاده تجاری مجاز است. برای شرایط خاص استفاده، لطفاً به توافقنامه مجوز مدل مراجعه کنید.

Mistral در مقایسه با سایر مدل‌های زبانی چگونه است؟

Mistral در تمام معیارهای ارزیابی از سایر مدل‌های متن‌باز برتر است و به سطح عملکرد مشابه با مدل‌های بسته پیشرو دست یافته است.

Mistral از چه چارچوب‌های استقراری پشتیبانی می‌کند؟

Mistral را می‌توان با چارچوب‌های متعددی مستقر کرد، از جمله SGLang، LMDeploy، TensorRT-LLM، vLLM و غیره، و از حالت‌های استنتاج FP8 و BF16 پشتیبانی می‌کند.

اندازه پنجره زمینه Mistral چقدر است؟

Mistral دارای پنجره زمینه ۱۲۸K است که امکان پردازش و درک مؤثر وظایف پیچیده و محتوای متنی طولانی را فراهم می‌کند.

شروع کار با Mistral

امتحان API دیپ‌سیک V3

دسترسی به قابلیت‌های Mistral از طریق پلتفرم API مناسب برای توسعه‌دهندگان

شروع توسعه

بررسی در گیت‌هاب

دسترسی به کد منبع، مستندات و مشارکت در Mistral

مشاهده مخزن

امتحان چت Mistral

تجربه قابلیت‌های Mistral به طور مستقیم از طریق رابط چت تعاملی ما

شروع گفتگو