Microsoft, 14 Milyar Parametreli Yeni Dil Modeli Phi-4’ü Tanıttı!
Microsoft, yapay zeka dünyasında dikkat çeken bir adım daha attı. Şirket 14 milyar parametreye sahip yeni nesil küçük dil modeli Phi-4’ü duyurdu. Phi-4, küçük dil modelleri kategorisinde yer almasına rağmen, MATH ve GPQA yapay zeka testlerinde OpenAI’ın GPT-4 gibi büyük modellerini geride bırakmayı başardı.
Microsoft, Phi-4’ün matematiksel akıl yürütme başarısını yüksek kaliteli sentetik veri setlerine ve organik veri seçimine borçlu olduğunu belirtti. Sentetik veriler, çoklu ajan modellemeleri, kendi kendine revizyon süreçleri ve talimat tersine çevirme gibi tekniklerle oluşturuldu. Bu sentetik veriler, modelin eğitim sürecindeki ana veri kaynağını oluşturuyor.
Eğitim sonrası süreçte, model çıktılarının doğruluğunu artırmak için red örnekleme (rejection sampling) gibi yöntemler kullanıldı. Ayrıca, Microsoft, web üzerinden benchmark test setlerinin sızdırılmasına karşı veri temizleme sürecini geliştirerek adil değerlendirme sonuçları elde etmeyi başardı.
Phi-4, 2024 Kasım ayında gerçekleştirilen AMC-10 ve AMC-12 matematik yarışmalarında test edildi. Bu yarışmalar, modelin eğitim verilerinden sonra düzenlendiği için sonuçların aşırı öğrenmeden etkilenmediği kanıtlandı. Microsoft, Phi-4’ün MATH benchmarkındaki üstün performansının veri kontaminasyonundan kaynaklanmadığını vurguladı.
Phi-4, küçük dil modeli sınıfında olmasına rağmen güçlü bir performans sergiliyor. Ancak, boyutunun getirdiği sınırlamalar da mevcut. Model, bazen gerçek bilgiye dayanmayan cevaplar üretebiliyor (halüsinasyon) ve detaylı talimatları izleme konusunda büyük modellere kıyasla daha az yetenekli.
Microsoft, modelin güvenliğini ve güvenilirliğini değerlendirmek için bağımsız bir AI Kırmızı Takımı (AIRT) ile çalıştı. Bu çalışmalar hem ortalama hem de kötü niyetli kullanıcı senaryolarında ortaya çıkabilecek riskleri ele aldı.
Microsoft Phi-4, Azure AI Foundry üzerinden Microsoft Research Lisans Anlaşması (MSRLA) kapsamında erişime açıldı. Ayrıca, önümüzdeki hafta Hugging Face platformunda da kullanıma sunulacak.