Meta merilis Llama 4 pada hari Minggu, dan komunitas AI telah mengkajinya dengan intensitas forensik yang biasanya hanya diperuntukkan bagi dokumen pengadilan yang bocor. Dua varian model diluncurkan secara bersamaan: Llama 4 Scout, model 17 miliar parameter yang dioptimalkan untuk penerapan lokal, dan Llama 4 Maverick, model mixture-of-experts 400 miliar parameter yang dirancang untuk beban kerja enterprise. Keduanya gratis untuk diunduh di bawah lisensi penggunaan terbuka Meta, yang mengizinkan penerapan komersial bagi organisasi dengan kurang dari 700 juta pengguna aktif bulanan — ambang batas yang mengecualikan hampir semua orang kecuali Meta sendiri dan segelintir raksasa teknologi lainnya.
Berita utama tentang Scout adalah bahwa model ini berjalan pada satu Nvidia RTX 4090 atau GPU konsumen setara dengan 24 GB VRAM. Itulah ambang batas yang telah ditunggu-tunggu para pengembang: model yang benar-benar mumpuni yang bisa dijalankan oleh pengembang solo atau tim kecil sepenuhnya pada perangkat keras mereka sendiri, tanpa membayar biaya inferensi cloud, tanpa mengirim data mereka ke server siapa pun. Dalam tolok ukur awal yang beredar di forum pengembang, Scout mencetak setara dengan GPT-5.4 mini dan Gemini 2.0 Flash pada tugas pengkodean dan penalaran standar, dan sedikit di atas keduanya dalam ekstraksi data terstruktur.
Continue reading to see the full article