Meta lanzó Llama 4 el domingo, y la comunidad de IA lo ha estado analizando con la intensidad forense que normalmente se reserva para documentos judiciales filtrados. Dos variantes del modelo se publicaron simultáneamente: Llama 4 Scout, un modelo de 17 mil millones de parámetros optimizado para implementación local, y Llama 4 Maverick, un modelo de mezcla de expertos de 400 mil millones de parámetros diseñado para cargas de trabajo empresariales. Ambos son gratuitos para descargar bajo la licencia de uso abierto de Meta, que permite la implementación comercial para organizaciones con menos de 700 millones de usuarios activos mensuales — un umbral que exime prácticamente a todos excepto a la propia Meta y a un puñado de otros gigantes tecnológicos.
El titular de Scout es que funciona en una sola Nvidia RTX 4090 o una GPU de consumo equivalente con 24 GB de VRAM. Ese ha sido un punto umbral que los desarrolladores estaban esperando: un modelo genuinamente capaz que un desarrollador en solitario o un equipo pequeño puede ejecutar completamente en su propio hardware, sin pagar costes de inferencia en la nube, sin enviar sus datos al servidor de nadie. En los primeros benchmarks que circulan por los foros de desarrolladores, Scout está obteniendo resultados similares a GPT-5.4 mini y Gemini 2.0 Flash en tareas estándar de programación y razonamiento, y ligeramente por encima de ambos en extracción de datos estructurados.
Continue reading to see the full article