Mistral

Mistral: Modèle de langage IA avancé avec 671B paramètres

Découvrez la prochaine génération de modèles de langage avec une efficacité révolutionnaire en raisonnement, codage et calcul mathématique

671B Paramètres

Codage avancé

Entraînement efficace

Essayer Mistral Accéder à l'API

Intégration Gratuite au Site Web

Vous avez un site web ? Intégrez gratuitement notre interface de chat avec un simple code iframe. Aucune inscription requise.

Essayez le chat Mistral gratuitement sans inscription

Mistral Chat

Fonctionnalités principales

Découvrez les fonctionnalités puissantes qui distinguent Mistral

Architecture MoE avancée

Modèle révolutionnaire de 671B paramètres avec seulement 37B paramètres activés par token, efficacité optimale grâce à l'équilibrage de charge innovant

•Attention latente multi-têtes (MLA)
•Équilibrage de charge sans perte
•Architecture MistralMoE
•Objectif de prédiction multi-tokens

Performance de pointe

Résultats exceptionnels dans plusieurs benchmarks, incluant MMLU (87,1%), BBH (87,5%) et tâches de raisonnement mathématique

•Scores les plus élevés en compétitions de programmation
•Calculs mathématiques avancés
•Capacités multilingues
•Tâches de raisonnement complexe

Entraînement efficace

Approche d'entraînement révolutionnaire avec seulement 2,788M heures GPU H800, remarquable efficacité coût de 5,5M$

•Entraînement en précision mixte FP8
•Framework d'entraînement optimisé
•Processus d'entraînement stable
•Aucun retour en arrière nécessaire

Déploiement polyvalent

Multiples options de déploiement avec support pour NVIDIA, AMD GPUs et Huawei Ascend NPUs pour une intégration flexible

•Prêt pour le déploiement cloud
•Support d'inférence locale
•Multiples plateformes matérielles
•Options de déploiement optimisées

Capacités de programmation avancées

Performance supérieure dans les tâches de programmation, excellant dans les scénarios de développement compétitif et du monde réel

•Support multilingue
•Complétion de code
•Détection d'erreurs
•Optimisation de code

Sécurité niveau entreprise

Mesures de sécurité complètes et fonctionnalités de conformité pour le déploiement et l'intégration en entreprise

•Contrôle d'accès
•Chiffrement des données
•Journalisation d'audit
•Prêt pour la conformité

Données d'entraînement étendues

Pré-entraîné sur 14,8T tokens diversifiés et de haute qualité, garantissant une large connaissance et des capacités

•Sources de données diverses
•Contenu filtré pour la qualité
•Domaines multiples
•Mises à jour régulières

Leadership en innovation

Avancées pionnières dans la technologie IA à travers la collaboration ouverte et l'innovation continue

•Leadership en recherche
•Collaboration ouverte
•Guidé par la communauté
•Améliorations régulières

Mistral dans les médias

Ouvrir de nouvelles voies dans le développement de l'IA open source

Performance révolutionnaire

Mistral surpasse les modèles d'IA open source et propriétaires dans les compétitions de programmation, excellant particulièrement dans les concours Codeforces et les tests Aider Polyglot.

Échelle massive

Construit avec 671 milliards de paramètres et entraîné sur 14,8 billions de tokens, soit 1,6 fois plus grand que le Llama 3.1 405B de Meta.

Développement rentable

Entraîné en seulement deux mois avec des GPU Nvidia H800, avec un coût de développement remarquablement efficace de 5,5 millions de dollars.

Mistral en action

Découvrez comment Mistral révolutionne les capacités de l'IA open source

Mistral : L'IA open source révolutionnaire

Un aperçu détaillé des capacités et des performances de Mistral par rapport aux autres modèles d'IA leaders.

Métriques de performance Mistral

Compréhension du langage Mistral

MMLU87.1%

BBH87.5%

DROP89.0%

Programmation Mistral

HumanEval65.2%

MBPP75.4%

CRUXEval68.5%

Mathématiques Mistral

GSM8K89.3%

MATH61.6%

CMath90.7%

Spécifications techniques

Découvrez les capacités techniques avancées et l'architecture de Mistral

Détails de l'architecture Mistral

Architecture neuronale avancée pour des performances et une efficacité optimales

•671B paramètres totaux avec activation dynamique de 37B par token

•Attention latente multi-têtes (MLA) pour une meilleure compréhension du contexte

•Architecture MistralMoE avec réseaux d'experts spécialisés

•Équilibrage de charge sans perte pour une utilisation optimale des ressources

•Objectif d'entraînement de prédiction multi-tokens pour une efficacité améliorée

•Mécanisme innovant de routage sparse

•Techniques avancées de partage de paramètres

•Système optimisé de gestion de la mémoire

Recherche Mistral

Repousser les limites des capacités des modèles de langage

Architecture novatrice

Architecture innovante de Mixture-of-Experts (MoE) avec stratégie d'équilibrage de charge sans perte auxiliaire

Méthodologie d'entraînement

Framework d'entraînement avancé en précision mixte FP8 validé sur l'entraînement de modèles à grande échelle

Article technique

Lisez notre article technique détaillant l'architecture, le processus d'entraînement et les résultats d'évaluation de Mistral.

Lire l'article

À propos de Mistral

Pionnier de l'avenir du développement de l'IA open source

Contexte de l'entreprise

Soutenu par High-Flyer Capital Management, Mistral vise à réaliser des avancées révolutionnaires dans la technologie de l'IA grâce à la collaboration ouverte et à l'innovation.

Infrastructure

Utilisant des clusters de calcul avancés comprenant 10 000 GPU Nvidia A100, Mistral démontre des capacités exceptionnelles dans l'entraînement de modèles à grande échelle.

Télécharger les modèles Mistral

Choisissez entre les versions de base et optimisée pour le chat de Mistral

Modèle de base Mistral

Le modèle fondamental avec 671B paramètres (37B activés)

Taille: 685GB

•Pré-entraîné sur 14,8T tokens
•Contexte de 128K
•Poids FP8
•671B paramètres totaux

Télécharger le modèle de base

Modèle de chat Mistral

Modèle affiné optimisé pour le dialogue et l'interaction

Taille: 685GB

•Raisonnement amélioré
•Contexte de 128K
•Meilleur suivi des instructions
•671B paramètres totaux

Télécharger le modèle de chat

Instructions d'installation

Téléchargement avec Git LFS (méthode recommandée) :

# For Base Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3-Base

# For Chat Model
git lfs install
git clone https://huggingface.co/Mistral-ai/Mistral-V3

Voir le modèle de base Voir le modèle de chat

Options de déploiement Mistral

Déploiement local Mistral

Exécution locale avec Mistral-Infer Demo, prend en charge l'inférence FP8 et BF16

Configuration simple
Démo légère
Options de précision multiples

Intégration cloud Mistral

Déploiement sur les plateformes cloud avec support SGLang et LMDeploy

Déploiement cloud natif
Infrastructure évolutive
Prêt pour l'entreprise

Support matériel Mistral

Compatible avec les GPU NVIDIA, AMD et les NPU Huawei Ascend

Support multi-fournisseurs
Performance optimisée
Déploiement flexible

Comment utiliser Mistral

Commencez à discuter avec Mistral en trois étapes simples

Étape 1

Visitez la page de chat

Cliquez sur le bouton "Try Chat" en haut de la page pour accéder à l'interface de chat

Étape 2

Entrez votre question

Tapez votre question dans la zone de saisie du chat

Étape 3

Attendez la réponse

Mistral générera rapidement une réponse, généralement en quelques secondes

Commencer à discuter maintenant

FAQ

En savoir plus sur Mistral

Qu'est-ce qui rend Mistral unique ?

Mistral dispose d'une architecture MoE de 671B paramètres, intégrant des innovations comme la prédiction multi-tokens et l'équilibrage de charge sans auxiliaire, offrant des performances exceptionnelles dans diverses tâches.

Comment puis-je accéder à Mistral ?

Vous pouvez accéder à Mistral via notre plateforme de démonstration en ligne et notre service API, ou télécharger les poids du modèle pour un déploiement local.

Dans quelles tâches Mistral excelle-t-il ?

Mistral excelle en mathématiques, programmation, raisonnement et tâches multilingues, obtenant constamment des scores élevés dans les évaluations de référence.

Quelles sont les exigences matérielles pour exécuter Mistral ?

Mistral prend en charge diverses options de déploiement, y compris les GPU NVIDIA, AMD et les NPU Huawei Ascend, avec plusieurs choix de frameworks pour des performances optimales.

Mistral est-il disponible pour un usage commercial ?

Oui, Mistral est disponible pour un usage commercial. Veuillez consulter l'accord de licence du modèle pour les conditions spécifiques d'utilisation.

Comment Mistral se compare-t-il aux autres modèles de langage ?

Mistral surpasse les autres modèles open-source dans divers benchmarks et atteint des performances comparables aux principaux modèles propriétaires.

Quels frameworks de déploiement Mistral prend-il en charge ?

Mistral peut être déployé en utilisant divers frameworks, notamment SGLang, LMDeploy, TensorRT-LLM, vLLM, et prend en charge les modes d'inférence FP8 et BF16.

Quelle est la taille de la fenêtre de contexte de Mistral ?

Mistral dispose d'une fenêtre de contexte de 128K, permettant un traitement et une compréhension efficaces des tâches complexes et du contenu long.

Commencer avec Mistral

Essayer l'API Mistral

Accédez aux capacités de Mistral via notre plateforme API conviviale pour les développeurs

Commencer à développer

Explorer sur GitHub

Accédez au code source, à la documentation et contribuez à Mistral

Voir le dépôt

Essayer le chat Mistral

Découvrez les capacités de Mistral directement via notre interface de chat interactive

Commencer à discuter