Qu'est-ce que Llama 4 Scout et quel matériel nécessite-t-il ?

Llama 4 Scout est le modèle de 17 milliards de paramètres de Meta, conçu pour un déploiement local. Il fonctionne sur un seul GPU grand public doté de 24 Go de VRAM, comme le Nvidia RTX 4090, ce qui le rend accessible aux développeurs individuels et aux petites équipes sans infrastructure cloud.

Comment Llama 4 Maverick se compare-t-il à GPT-5.4 et Claude ?

Sur les tests de référence, Llama 4 Maverick a obtenu 87,4 sur le MMLU (contre 86,1 pour GPT-5.4 et 85,8 pour Claude 3.7 Sonnet) et 79,6 sur le benchmark MATH, ce qui le rend compétitif ou supérieur aux modèles frontier à source fermée sur plusieurs tâches de raisonnement.

Llama 4 est-il gratuit pour un usage commercial ?

Oui. Llama 4 est gratuit au téléchargement et à l'utilisation commerciale dans le cadre de la licence d'utilisation ouverte de Meta. La principale restriction concerne les organisations dépassant 700 millions d'utilisateurs actifs mensuels, ce qui n'affecte en pratique que les plus grandes entreprises technologiques.

Meta vient de lancer Llama 4 — et la course à…

Llama 4 Scout et Llama 4 Maverick sont disponibles dès maintenant. Scout tourne sur un seul GPU grand public. Maverick surpasse GPT-5.4 mini sur les tâches de raisonnement. Les deux sont gratuits au téléchargement.

Meta a publié Llama 4 dimanche, et la communauté de l'IA s'y est plongée avec une intensité médico-légale habituellement réservée aux documents judiciaires divulgués. Deux variantes du modèle ont été publiées simultanément : Llama 4 Scout, un modèle de 17 milliards de paramètres optimisé pour le déploiement local, et Llama 4 Maverick, un modèle mixture-of-experts de 400 milliards de paramètres conçu pour les charges de travail en entreprise. Les deux sont gratuits au téléchargement sous la licence d'utilisation ouverte de Meta, qui autorise le déploiement commercial pour les organisations comptant moins de 700 millions d'utilisateurs actifs mensuels — un seuil qui exempte à peu près tout le monde sauf Meta elle-même et une poignée d'autres géants technologiques.

Le fait marquant concernant Scout, c'est qu'il fonctionne sur un seul Nvidia RTX 4090 ou GPU grand public équivalent doté de 24 Go de VRAM. C'est un seuil que les développeurs attendaient : un modèle véritablement capable qu'un développeur solo ou une petite équipe peut faire tourner entièrement sur son propre matériel, sans payer des coûts d'inférence cloud, sans envoyer ses données vers le serveur de qui que ce soit. Dans les premiers benchmarks qui circulent sur les forums de développeurs, Scout obtient des scores comparables à GPT-5.4 mini et Gemini 2.0 Flash sur les tâches standard de codage et de raisonnement, et légèrement supérieurs sur l'extraction de données structurées.

Maverick est une autre bête. Le nombre de 400 milliards de paramètres peut sembler imposant, mais l'architecture mixture-of-experts signifie que seule une fraction des paramètres est active lors de chaque passe d'inférence — environ 17 milliards, soit à peu près la taille totale de Scout. Le résultat pratique est que Maverick nécessite moins de calcul par requête qu'un modèle dense de 400 milliards de paramètres, tout en conservant la profondeur de connaissance et de raisonnement d'un réseau beaucoup plus grand. Sur le benchmark MMLU, Maverick a obtenu 87,4, contre 86,1 pour GPT-5.4 et 85,8 pour Claude 3.7 Sonnet. Sur le raisonnement mathématique (benchmark MATH), Maverick a atteint 79,6, ce qui est nettement supérieur à tout modèle open source publié avant lui.

Continue reading to see the full article

Meta vient de lancer Llama 4 — et la course à l'IA open source reprend de plus belle

Points Clés

Questions Fréquemment Posées

Meta vient de lancer Llama 4 — et la course à l'IA open source reprend de plus belle

Points Clés

Questions Fréquemment Posées

Plus dans Tech & AI