بررسی Mistral: مدل هوش مصنوعی متن‌باز که از Claude پیشی می‌گیرد

2025-01-10

تحلیل کامل را تماشا کنید:

مقدمه و ویژگی‌ها

  • نسخه: Mistral
  • عملکرد: ۳ برابر سریع‌تر از V2
  • سازگاری APA: کامل
  • مدل متن‌باز: برابر با Claude 3.5 Sonnet، برتر از Claude 30 Sonnet
  • مقیاس مدل: ۶۷.۱ میلیارد مدل ترکیبی متخصصان، ۳۷ میلیارد پارامتر فعال
  • داده‌های آموزشی: ۱۴ تریلیون توکن با کیفیت بالا
  • مقرون به صرفه: یکی از کم‌هزینه‌ترین‌ها، به‌ویژه قبل از ۸ فوریه

مقایسه عملکرد

  • معیار ریاضی: Mistral نمره ۹۰ را کسب می‌کند، بالاتر از نمره ۷۴.۶ GPT-40
  • درک زبان: Mistral در چندین آزمون معیار برتری دارد

معماری و فناوری

  • معماری پایه: بلوک‌های Transformer، ترکیب متخصصان (MoE)
  • مکانیزم توجه: توجه نهفته چندسر، پشتیبانی از ۱۲۸,۰۰۰ توکن
  • قابلیت حافظه: توانایی به یاد سپردن هر بیت اطلاعات در توالی‌های طولانی

آزمون‌های برنامه‌نویسی

  • آزمون‌های پایتون: مسائل چالش‌برانگیز شامل تولید ماتریس واحد، ک.م.م، دنباله Faray و دنباله ECG
  • آزمون‌های جاوااسکریپت: چالش‌های پیشرفته مانند مسئله Josephus
  • نتایج: Mistral در آزمون‌های سطح متخصص عملکرد عالی دارد، رفع خطاها و عبور از اکثر چالش‌ها

آزمون‌های منطق و استدلال

  • مسائل منطقی: مانند شمارش تعداد "O" در کلمه "strawberry"
  • توانایی استدلال: حل موفقیت‌آمیز مجموعه‌ای از مسائل منطقی

آزمون‌های رفتار خودمختار

  • رفتار عامل: آزمایش با استفاده از بسته Praise AI
  • مثال وظیفه: ایجاد فیلمنامه درباره گربه گمشده
  • نتایج: عامل‌ها به صورت مشارکتی کار می‌کنند، استفاده از ابزارهای جستجو و تکمیل وظایف

آزمون‌های گمراه‌کننده

  • آزمون سناریو: مسئله تراموای Runway
  • نتایج: Mistral محدودیت‌هایی در مدیریت قضاوت‌های اخلاقی نشان می‌دهد

خلاصه

  • Mistral برابر با Claude 3.5 Sonnet است، در برخی معیارها برتری دارد
  • متن‌باز، مقرون به صرفه و برتر در آزمون‌های برنامه‌نویسی سطح متخصص و استدلال منطقی
  • قابلیت‌های رفتار خودمختار خوب اما با چالش‌هایی در آزمون‌های گمراه‌کننده مواجه است

فراخوان به عمل

  • عضویت در کانال یوتیوب: اطلاع از پیشرفت‌های هوش مصنوعی
  • تماشای ویدیوهای دیگر: درباره انتشار مدل Reason L از OpenAI