2025-01-10
تحلیل کامل را تماشا کنید:
مقدمه و ویژگیها
- نسخه: Mistral
- عملکرد: ۳ برابر سریعتر از V2
- سازگاری APA: کامل
- مدل متنباز: برابر با Claude 3.5 Sonnet، برتر از Claude 30 Sonnet
- مقیاس مدل: ۶۷.۱ میلیارد مدل ترکیبی متخصصان، ۳۷ میلیارد پارامتر فعال
- دادههای آموزشی: ۱۴ تریلیون توکن با کیفیت بالا
- مقرون به صرفه: یکی از کمهزینهترینها، بهویژه قبل از ۸ فوریه
مقایسه عملکرد
- معیار ریاضی: Mistral نمره ۹۰ را کسب میکند، بالاتر از نمره ۷۴.۶ GPT-40
- درک زبان: Mistral در چندین آزمون معیار برتری دارد
معماری و فناوری
- معماری پایه: بلوکهای Transformer، ترکیب متخصصان (MoE)
- مکانیزم توجه: توجه نهفته چندسر، پشتیبانی از ۱۲۸,۰۰۰ توکن
- قابلیت حافظه: توانایی به یاد سپردن هر بیت اطلاعات در توالیهای طولانی
آزمونهای برنامهنویسی
- آزمونهای پایتون: مسائل چالشبرانگیز شامل تولید ماتریس واحد، ک.م.م، دنباله Faray و دنباله ECG
- آزمونهای جاوااسکریپت: چالشهای پیشرفته مانند مسئله Josephus
- نتایج: Mistral در آزمونهای سطح متخصص عملکرد عالی دارد، رفع خطاها و عبور از اکثر چالشها
آزمونهای منطق و استدلال
- مسائل منطقی: مانند شمارش تعداد "O" در کلمه "strawberry"
- توانایی استدلال: حل موفقیتآمیز مجموعهای از مسائل منطقی
آزمونهای رفتار خودمختار
- رفتار عامل: آزمایش با استفاده از بسته Praise AI
- مثال وظیفه: ایجاد فیلمنامه درباره گربه گمشده
- نتایج: عاملها به صورت مشارکتی کار میکنند، استفاده از ابزارهای جستجو و تکمیل وظایف
آزمونهای گمراهکننده
- آزمون سناریو: مسئله تراموای Runway
- نتایج: Mistral محدودیتهایی در مدیریت قضاوتهای اخلاقی نشان میدهد
خلاصه
- Mistral برابر با Claude 3.5 Sonnet است، در برخی معیارها برتری دارد
- متنباز، مقرون به صرفه و برتر در آزمونهای برنامهنویسی سطح متخصص و استدلال منطقی
- قابلیتهای رفتار خودمختار خوب اما با چالشهایی در آزمونهای گمراهکننده مواجه است
فراخوان به عمل
- عضویت در کانال یوتیوب: اطلاع از پیشرفتهای هوش مصنوعی
- تماشای ویدیوهای دیگر: درباره انتشار مدل Reason L از OpenAI