Meta hat am Sonntag Llama 4 veröffentlicht, und die KI-Community hat das Modell mit jener forensischen Intensität analysiert, die man sonst geleakten Gerichtsdokumenten vorbehält. Zwei Modellvarianten wurden gleichzeitig veröffentlicht: Llama 4 Scout, ein Modell mit 17 Milliarden Parametern, das für den lokalen Einsatz optimiert ist, und Llama 4 Maverick, ein Mixture-of-Experts-Modell mit 400 Milliarden Parametern, das für Enterprise-Workloads konzipiert wurde. Beide sind unter Metas Open-Use-Lizenz kostenlos erhältlich, die den kommerziellen Einsatz für Organisationen mit weniger als 700 Millionen monatlich aktiven Nutzern erlaubt — eine Schwelle, die praktisch jeden außer Meta selbst und einer Handvoll anderer Tech-Giganten ausschließt.
Das Besondere an Scout ist, dass es auf einer einzigen Nvidia RTX 4090 oder einer vergleichbaren Consumer-GPU mit 24 GB VRAM läuft. Das war ein Schwellenwert, auf den Entwickler gewartet haben: ein wirklich leistungsfähiges Modell, das ein einzelner Entwickler oder ein kleines Team vollständig auf eigener Hardware betreiben kann — ohne Cloud-Inferenzkosten, ohne Daten an fremde Server zu senden. In ersten Benchmarks, die in Entwicklerforen kursieren, erzielt Scout vergleichbare Ergebnisse wie GPT-5.4 mini und Gemini 2.0 Flash bei Standard-Coding- und Reasoning-Aufgaben und übertrifft beide leicht bei der Extraktion strukturierter Daten.
Continue reading to see the full article