Kaynak: Meta AI

Llama 3.1, 405B Çıktı!

Erdinç Dal
Nane & Limon
Published in
5 min readJul 24, 2024

--

Meta, yapay zeka modeli Llama’nın en yeni versiyonu olan Llama 3.1'i duyurdu. Bu yeni model, üç farklı sürümle geliyor ve bunlardan biri Meta’nın şimdiye kadar yarattığı en gelişmiş yapay zeka modeli. Köklerine sadık kalarak, Llama 3.1 açık kaynak olmaya devam ediyor, yani herkes tarafından ücretsiz olarak erişilebilir durumda.

Kaynak: Meta AI

Bu lansman, Meta’nın yapay zekaya yaptığı önemli yatırımın bir kanıtı ve OpenAI, Anthropic, Google ve Amazon gibi sektör liderleriyle rekabet etme amacını bizlere gösteriyor.

Nvidia ile Güçlenen Ortaklık:

Kaynak: https://nvidianews.nvidia.com/

Bu lansmanın dikkat çeken bir yönü, Meta ve Nvidia arasındaki iş birliğinin giderek derinleşmesi. Nvidia, Llama 3.1 dahil olmak üzere Meta’nın yapay zeka modellerinin eğitiminde kritik öneme sahip GPU’ları sağlıyor. OpenAI gibi şirketler kendi özel modellerinden gelir elde ederken, Meta’nın benzer şekilde kurumsal teknoloji pazarına girme planı yok. Bunun yerine Meta, Llama 3.1'i Amazon Web Services, Google Cloud ve Microsoft Azure gibi teknoloji devleriyle iş birliği yaparak onların platformları üzerinden sunmayı tercih ediyor.

Açık Kaynak Stratejisi ve Faydaları

Meta CEO’su Mark Zuckerberg, bu ortaklıklardan bir miktar gelir elde ettiklerini, ancak asıl hedefin farklı olduğunu daha önce belirtmişti. Meta, Llama ve ilgili teknolojileri açık kaynak yaparak, en iyi yetenekleri çekmeyi ve hesaplama maliyetlerini düşürmeyi amaçlıyor. Ayrıca bu yaklaşım, Meta’nın araçlarını geliştirebilecek ve üzerine inşa edebilecek bir geliştirici topluluğu oluşturarak, nihayetinde şirketin içeride de fayda sağlamasına olanak tanıyor.

Llama 3.1'in Meta Ekosistemindeki Rolü

Llama 3.1'in piyasaya sürülme zamanlaması, Zuckerberg ve Nvidia CEO’su Jensen Huang’ın konuşma yapacağı bir konferansla aynı döneme denk geliyor. Nvidia’nın önemli bir müşterisi olan Meta, modellerini eğitmek için en son GPU’lara güveniyor. Llama 3.1'in en büyük versiyonu olan 405B modeli, Nvidia’nın 16.000 adet H100 işlemcisi kullanılarak eğitildi. Bu iş birliği karşılıklı fayda sağlıyor; Meta ihtiyaç duyduğu GPU’ları elde ederken, Nvidia da Meta’nın açık kaynak modellerinin yaygın kullanımı teşvik etmesiyle çiplerine olan talebin artışını görüyor.

Llama 3.1'in Sunduğu Yenilikler

Image from reddit.com

Llama 3.1 Ailesinin Özellikleri

Llama 3.1 ailesi, 405 milyar parametreye sahip devasa 405B modelini içeriyor. Bu yüksek parametre sayısı, modelin uzun metin bağlamlarını anlama, karmaşık matematik problemlerini çözme ve sentetik veri üretme gibi karmaşık görevleri gerçekleştirmesine olanak tanıyor. Ayrıca, sohbet robotları ve kodlama asistanları gibi uygulamalar için daha küçük olan Llama 3.1 8B ve 70B modelleri de mevcut.

Llama 3.1 ile Pratik Deneyim

Meta, ABD’deki WhatsApp kullanıcılarına ve Meta.AI web sitesi ziyaretçilerine Llama 3.1 ile pratik bir deneyim sunuyor. Kullanıcılar, karmaşık soruları yanıtlayabilen ve kodlama problemlerini çözebilen Llama 3.1 destekli dijital asistanla etkileşime girebilecekler. Sorguları için büyük 405B model ile daha küçük ve hızlı versiyonlar arasında seçim yapabilecekler.

Yapay Zeka Geliştirmede Özgün Bir Yaklaşım

Zuckerberg, Salı günü yayınladığı bir blog yazısında, bu haftaki Llama lansmanında “farklı bir yaklaşım” benimsediklerini belirterek şunları ekledi:

“Ekosistemdeki daha fazla şirketin müşterilerine özgün işlevsellik sunabilmesi için aktif olarak ortaklıklar kuruyoruz.”

Meta’nın kurumsal bir satıcı olarak faaliyet göstermemesi, Llama ile ilgilenen işletmeleri Nvidia gibi kurumsal ortaklarına yönlendirebilmesini sağlıyor.

Yapay Zeka Gelişiminde Daha Geniş Etkiler

Bazı geliştiriciler, yeni Llama sürümünün yapay zeka gelişiminde geniş etkileri olabileceğini söylüyor. Açık kaynaklı bir yapay zeka projesi olan EleutherAI’nin yönetici direktörü Stella Biderman, Llama 3'ün tam olarak açık kaynak olmadığını belirtiyor. Ancak Biderman, Meta’nın en son lisansındaki bir değişikliğin, geliştiricilerin Llama 3'ü kullanarak kendi modellerini eğitmelerine izin vereceğini vurguluyor. Bu, çoğu yapay zeka şirketinin şu anda yasakladığı bir şey. Biderman, “Bu gerçekten çok büyük bir olay,” diyor.

OpenAI ve Google’ın en son modellerinin aksine, Llama “çok modlu” değil, yani görüntü, ses ve videoyu işlemek üzere tasarlanmamış. Ancak Meta, modelin web tarayıcısı gibi diğer yazılımları kullanmada önemli ölçüde daha iyi olduğunu söylüyor. Bu, birçok araştırmacı ve şirketin yapay zekayı daha faydalı hale getirebileceğine inandığı bir özellik.

Yapay Zeka Güvenliği Endişelerini Ele Almak

Meta, NIST ve ML Commons gibi küresel organizasyonlarla iş birliği yaparak ortak standartlar ve en iyi uygulamaları tanımlayarak yapay zeka güvenliğini artırıyor. Kapsamlı risk değerlendirmeleri ve kırmızı takım çalışmaları yürütüyor, AWS ve Nvidia ile ortaklık kurarak güvenliği yapay zeka dağıtımına entegre ediyor. Llama Guard 3 ve Prompt Guard gibi araçları, geliştiricilerin siber güvenlik tehditleri ve prompt enjeksiyonları gibi riskleri tespit etmesine ve azaltmasına yardımcı oluyor, güvenli yapay zeka uygulamalarını sağlıyor. Meta’nın yaklaşımı, kaynakları ve değerlendirmeleri paylaşmayı içeriyor, bu da geliştiricilerin yapay zeka güvenlik önlemlerini ihtiyaçlarına göre uyarlamasına olanak tanırken yapay zeka güvenliği araştırmalarını ilerletiyor.

Ayrıca Meta, siber güvenlik, kimyasal ve biyolojik silahlar, çocuk güvenliği ve gizlilik konularında kapsamlı risk değerlendirmelerine odaklanıyor. Modelleri ince ayar yapma ve belirli tehditleri ele almak için CyberSecEval 3 gibi araçlar geliştirme gibi detaylı test ve azaltma çabaları yürütüyor. Şeffaflık ve güvenliğe olan bağlılıkları, çalışmaları açık kaynak haline getirmeyi ve yapay zeka modellerini sürekli olarak iyileştirmek için uzmanlarla iş birliği yapmayı içeriyor, böylece yüksek güvenlik standartlarını karşıladıklarından ve sorumlu yapay zeka gelişimini desteklediklerinden emin oluyorlar.

Meta’nın yapay zeka güvenliği vizyonu, Llama Guard 3 ve Prompt Guard gibi araçlar aracılığıyla geliştiricilere sağlam bir temel sağlamayı da kapsıyor. Bu araçlar, zararlı içeriği tespit etmeye ve kötü niyetli girdilere karşı koruma sağlamaya yardımcı oluyor. Bu kaynakları sunarak ve kapsamlı güvenlik değerlendirmeleri yaparak Meta, geliştiricilerin güvenli ve etkili yapay zeka uygulamaları oluşturmasını amaçlıyor. Açıklığa öncelik vermeye, ilerlemelerini ve güvenlik önlemlerini paylaşmaya devam ederek yapay zeka topluluğunda iş birliği ve yeniliği teşvik ediyorlar. Daha fazla ayrıntı araştırma makalelerinde sunuluyor.

Not: Llama 3.1, normal bir bilgisayarda çalıştırılamayacak kadar büyük, ancak Meta, Databricks, Groq, AWS ve Google Cloud gibi birçok bulut sağlayıcının, geliştiricilerin modelin özel versiyonlarını çalıştırmasını sağlamak için performanslı seçenekler sunacağını garanti ediyor. Ayrıca, modele doğrudan Meta.ai üzerinden erişilebilir.

--

--

Erdinç Dal
Nane & Limon

Machine learner, Python geek and scikit-learn developer.