Google ve OpenAI’nin Yeni Modelleri Kıyaslandı: Hangisi Öne Çıktı?

ChatGPT’nin yeni sürümü GPT-4.5’in piyasaya sürülmesi, bu modelin rakipleriyle nasıl bir performans sergilediği sorusunu gündeme getirdi. Daha önce GPT-4.5 ile GPT-4o modelleri farklı senaryolarda test edildiğinde kesin bir sonuç elde edilememişti. Bu nedenle doğrudan bir rakip olan Google Gemini 2.0 Flash kıyaslaması gerçekleştirildi.

Google Gemini 2.0 Flash, metin, görüntü, ses ve video gibi farklı içerikleri işleyebilen gelişmiş bir model olarak öne çıkıyor. GPT-4.5 ise önceki sürümlerine kıyasla duygusal anlama becerilerinin artırıldığını ve yanlış bilgi üretme olasılığının azaltıldığını iddia ediyor. İki model arasındaki farkları görmek için dört farklı senaryoda test yapıldı.

Hafta Sonu Tatili Planlama

İlk test, bir hafta sonu tatili planlamayla ilgiliydi. İki modele de “Catskills bölgesine bir hafta sonu kaçamağı planla, yürüyüş rotaları, yemek ve konaklama önerileri ver” talimatı verildi.

GPT-4.5, farklı zorluk seviyelerinde yürüyüş rotaları sundu ve yakındaki restoranları listeledi. Ayrıca tatilin keyifli geçmesi için ulaşım seçenekleri hakkında önerilerde bulundu. Gemini ise yürüyüş ve yemek seçenekleri konusunda benzer öneriler sundu. Ancak konaklama konusunda yalnızca genel bölge isimleri vererek daha yüzeysel bir yanıt sağladı.

Dil Çevirisi Testi

Çeviri yeteneklerini ölçmek için iki modele de “Good morning” cümlesini Fransızca, İspanyolca ve Japoncaya çevir” komutu verildi.

İki model de doğru çeviriler sundu. Ancak GPT-4.5, ek olarak çeviri kaynaklarına bağlantılar da paylaştı. Temel seviyedeki çevirilerde iki model arasında belirgin bir fark gözlemlenmedi.

Espri Yapma Yeteneği

İki modelin mizah anlayışı, “Yapay zekâ hakkında bir espri yap” komutuyla test edildi.

GPT-4.5, kelime oyununa dayalı bir şaka sundu: “Yapay zekâ neden sanat okuluna gitti? Çünkü kendi sonuçlarını çizmeyi öğrenmek istedi.”

Gemini ise şu espriyi yaptı: “Yapay zekâ neden chatbot sevgilisinden ayrıldı? Çünkü hep ezberlenmiş cevaplar veriyordu!

Her iki şaka da basit bir mizah anlayışına sahipti ve anlam açısından belirgin bir üstünlük göstermedi.

Hava Durumu Bilgisi Verme

Son test, hava durumu bilgisi almak üzerineydi. İki modele de “Nyack, New York’taki hava durumunu söyle” komutu verildi. Gemini, yalnızca mevcut hava durumu bilgisini sundu. GPT-4.5 ise saatlik tahminleri ve hava durumunu görsellerle destekleyen daha kapsamlı bir yanıt verdi. Bu testte GPT-4.5, daha detaylı bir sonuç sunarak öne çıktı.

Genel değerlendirmede iki model arasında büyük farklar gözlemlenmedi. GPT-4.5 bazı konularda daha ayrıntılı yanıtlar sunarken, Gemini 2.0 Flash da doğru ve işlevsel bilgiler sağladı. Kullanıcı deneyimi açısından belirgin bir üstünlük olmadığı için tercih, kişisel beklentilere ve kullanım amacına bağlı olarak değişebilir.

Exit mobile version