Senin, 7 April 2025

Meta Rilis Llama 4, Generasi Baru Model AI Andalan Mereka

Laporan oleh Billy Patoppoi
Bagikan
Llama 4 generasi baru dari model-model AI andalan Meta. Foto: Meta

Meta resmi meluncurkan koleksi terbaru dari keluarga model kecerdasan buatan (artificial intelligence/AI) Llama, yaitu Llama 4 Scout, Llama 4 Maverick, dan Llama 4 Behemoth.

Ketiganya merupakan bagian dari gelombang baru pengembangan model AI yang dirancang dengan pendekatan multimodal, menggabungkan data teks, gambar, dan video yang tidak dilabeli untuk menciptakan pemahaman visual yang lebih luas.

Langkah ini disebut sebagai respons langsung terhadap kemajuan signifikan dari laboratorium AI asal Tiongkok, DeepSeek, yang berhasil merilis model-model open-source dengan performa setara atau bahkan lebih unggul dibanding Llama generasi sebelumnya.

Keberhasilan DeepSeek bahkan disebut-sebut mendorong Meta mengadakan rapat darurat internal untuk mempelajari strategi efisiensi biaya operasional serta optimalisasi model seperti DeepSeek R1 dan V3.

Dilansir dari TechCrunch, Senin (7/4/2025), dua dari tiga model baru—Scout dan Maverick—sudah dapat diakses secara terbuka melalui situs Llama.com dan mitra pengembang seperti Hugging Face. Sementara model Behemoth masih dalam tahap pelatihan.

Meta juga mengumumkan bahwa asisten virtual Meta AI yang digunakan di berbagai aplikasi mereka seperti WhatsApp, Messenger, dan Instagram kini telah diperbarui menggunakan Llama 4 di 40 negara. Namun, fitur multimodalnya untuk saat ini hanya tersedia di Amerika Serikat dalam bahasa Inggris.

Ketiga model ini menjadi tonggak baru karena untuk pertama kalinya Meta menggunakan arsitektur mixture of experts (MoE). Teknologi ini memungkinkan proses komputasi lebih efisien karena membagi tugas ke dalam sub-komponen yang dikerjakan oleh “ahli-ahli” kecil yang fokus pada tugas tertentu.

Maverick misalnya, memiliki 400 miliar parameter total dengan 128 “ahli”, namun hanya 17 miliar parameter yang aktif saat menjalankan tugas. Scout juga memiliki 17 miliar parameter aktif dengan total 109 miliar parameter dan 16 ahli.

Meta menyebut Maverick sebagai model terbaik untuk penggunaan umum seperti penulisan kreatif dan percakapan. Dalam pengujian internal, Maverick diklaim mampu mengungguli GPT-4o dari OpenAI dan Gemini 2.0 dari Google dalam berbagai tolok ukur seperti pengkodean, penalaran, kemampuan multibahasa, pengolahan konteks panjang, dan pemahaman gambar. Namun, model ini masih tertinggal dibandingkan model AI terkini seperti Google Gemini 2.5 Pro, Claude 3.7 Sonnet, dan GPT-4.5 dari OpenAI.

Sementara itu, Scout menunjukkan keunggulan dalam merangkum dokumen sangat panjang dan menganalisis kode berskala besar. Dengan jendela konteks hingga 10 juta token, model ini dapat memproses jutaan kata dan menerima input gambar dalam satu sesi. Scout juga cukup ringan dan dapat dijalankan hanya dengan satu GPU Nvidia H100, sedangkan Maverick memerlukan sistem Nvidia H100 DGX atau setara.

Model ketiga, Behemoth, masih dalam proses pelatihan dan disebut akan memerlukan perangkat keras yang jauh lebih kuat. Behemoth memiliki hampir dua triliun parameter total, dengan 288 miliar parameter aktif dan 16 ahli. Meta mengklaim model ini unggul dalam berbagai evaluasi keterampilan STEM, termasuk pemecahan masalah matematika, dan dapat mengalahkan GPT-4.5, Claude 3.7 Sonnet, dan Gemini 2.0 Pro. Namun, performanya masih belum melampaui Gemini 2.5 Pro.

Meski menawarkan performa tinggi, model-model Llama 4 ini memiliki sejumlah batasan dalam hal lisensi. Meta melarang pengguna dan perusahaan yang berbasis atau memiliki kantor pusat di Uni Eropa untuk menggunakan atau mendistribusikan model ini.

Hal ini kemungkinan besar berkaitan dengan regulasi ketat seputar AI dan perlindungan data di kawasan tersebut. Selain itu, perusahaan dengan lebih dari 700 juta pengguna aktif bulanan diwajibkan mengajukan lisensi khusus kepada Meta, yang dapat diberikan atau ditolak sesuai kebijakan internal.

Salah satu hal yang paling mencolok dari Llama 4 adalah peningkatan dalam kemampuan menjawab pertanyaan sensitif atau kontroversial. Meta menyebutkan bahwa semua model Llama 4 telah dirancang untuk lebih jarang menolak pertanyaan seperti itu, berbeda dari generasi sebelumnya yang cenderung menghindari topik-topik yang “diperdebatkan.”

Menurut Meta, Llama 4 kini mampu memberikan respons yang faktual, membantu, dan tidak menghakimi terhadap berbagai sudut pandang. “Anda dapat mengandalkan Llama 4 untuk memberikan jawaban yang membantu dan faktual tanpa menghakimi,” kata juru bicara Meta.

“Kami terus berupaya membuat Llama lebih responsif sehingga dapat menjawab lebih banyak pertanyaan, merespons berbagai sudut pandang dan tidak memihak pandangan tertentu.”

Langkah ini dilakukan di tengah tudingan bahwa sejumlah chatbot AI dianggap terlalu “woke” secara politik. Beberapa tokoh konservatif AS, termasuk Elon Musk dan David Sacks penasihat teknologi Donald Trump Presiden AS, menuding chatbot seperti ChatGPT menyensor pandangan konservatif.

Sacks bahkan menyebut model buatan OpenAI sebagai “terprogram untuk menjadi woke” dan tidak jujur saat membahas isu-isu politik. Ironisnya, perusahaan AI milik Musk sendiri, xAI, juga dilaporkan kesulitan menciptakan model AI yang sepenuhnya bebas dari bias politik.

Meskipun begitu, bias dalam AI tetap menjadi tantangan teknis yang rumit. Seperti Meta, perusahaan-perusahaan besar lain seperti OpenAI juga terus melakukan penyesuaian agar model-model mereka dapat memberikan jawaban lebih luas terhadap pertanyaan sensitif, tanpa mengorbankan akurasi dan tanggung jawab.

Meta menyebut Llama 4 sebagai langkah awal menuju masa depan baru dalam pengembangan AI open-source. “Ini baru permulaan bagi koleksi Llama 4,” tulis perusahaan itu dalam unggahan blog resminya. (nis/bil/ham)

Berita Terkait

Potret NetterSelengkapnya

Motor Tabrak Belakang Suroboyo Bus

Kebakaran Tempat Laundry di Simo Tambaan

Kecelakaan Mobil Listrik Masuk ke Sungai

Awan Lentikulari di Penanggungan Mojokerto

Surabaya
Senin, 7 April 2025
29o
Kurs