Meta, Llama 2’nin Microsoft ile genişletilmiş bir ortaklık sayesinde Windows‘un yanı sıra Qualcomm’un Snapdragon yongalarını barındıran akıllı telefonlar ve PC’ler için optimize edildiğini ve çalıştırılmasının daha kolay olacağını söylüyor. (Qualcomm, Llama 2’yi 2024 yılında Snapdragon cihazlarına getirmek için çalıştığını söylüyor).
Llama 2’nin Llama’dan farkı nedir?
Llama 2 aynı zamanda iki trilyonbelirteç üzerine eğitildi, burada “belirteçler” ham metni temsil ediyor. Bu sayı, Llama’nın eğitildiği sayının (1,4 trilyon) neredeyse iki katı kadar ve genel olarak konuşmak gerekirse, yapay zeka söz konusu olduğunda ne kadar çok belirteç olursa o kadar iyi. Bu arada Google’ın mevcut amiral gemisi olan büyük dil modeli (LLM) PaLM 2‘nin 3,6 trilyon belirteç üzerinde eğitildiği bildiriliyor ve OpenAI’ın GPT-4 modelinin ise trilyonlarca belirteç üzerinde eğitildiği tahmin ediliyor.
Meta ayrıca Llama 2’nin, tüm üretken yapay zeka modelleri gibi, belirli eksenlerde önyargılara sahip olduğunu kabul ediyor. Örneğin Llama 2, eğitim verilerindeki dengesizlikler nedeniyle “erkek” zamirlerini “kadın” zamirlerinden daha yüksek oranda üretmeye meyilli. Eğitim verilerindeki toksik metinlerin bir sonucu olarak, toksisite kıyaslamalarında diğer modellerden daha iyi performans göstermiyor.
Son olarak, açık kaynak modellerinin doğası gereği, modellerin tam olarak nasıl ya da nerede kullanılacağını söylemek mümkün değil. İnternetin yıldırım hızıyla hareket ettiği düşünülürse, bunu öğrenmemiz çok uzun sürmeyecektir.
Bir yanıt bırakın