ChatGPT, GPT-4o ile Artık Daha Gerçekçi Görseller Üretebilecek

ÇözümPark Haber 26/03/2025

0 1 dakika okuma süresi

OpenAI, ChatGPT’nin görsel oluşturma yeteneklerini önemli ölçüde geliştirdi. GPT-4o modeliyle entegre edilen yeni özellik sayesinde kullanıcılar artık daha gerçekçi ve detaylı görseller üretebiliyor.

ChatGPT 4o Image Generation Kullanıcıların Hizmetine Sunuldu

OpenAI, “4o Image Generation” adını verdiği yeni görüntü oluşturma özelliğini bugün itibarıyla tüm kullanıcıların hizmetine sundu. Ücretsiz kullanıcılar belirli bir sınır dâhilinde bu özellikten yararlanabilirken, ücretli planlara sahip olanlar daha geniş imkanlara sahip olacak. Daha önce ücretsiz kullanıcılar DALL-E 3 ile günde yalnızca üç görsel oluşturabiliyordu.

GPT-4o, metin, görüntü, ses ve video gibi farklı veri türlerini işleyebilme kapasitesiyle öne çıkıyor. Bu çok yönlülük, oluşturulan görsellerin detay seviyesini artırıyor. Modelin en dikkat çeken özelliklerinden biri, karmaşık nesne ve özellik ilişkilerini doğru şekilde anlayabilmesi. Örneğin, bir kompozisyonda birden fazla nesnenin renk ve şekil özelliklerini karıştırmadan doğru bir şekilde işleyebiliyor.

Geleneksel yapay zekâ modelleri, görsellerde metin oluştururken sıklıkla hatalar yapabiliyor. GPT-4o, bu sorunu büyük ölçüde çözerek daha tutarlı ve okunabilir metinler üretiyor. OpenAI, modeli eğitirken kamuya açık verilerin yanı sıra Shutterstock gibi platformlardan elde edilen lisanslı içerikleri de kullandığını açıkladı.

DALL-E gibi modeller genellikle difüzyon modeli tekniğiyle çalışıyor. OpenAI ise GPT-4o’da farklı bir yaklaşım benimseyerek görüntüleri satır satır ve sütun sütun oluşturan otoregresif bir yöntem kullanıyor. Bu teknik, özellikle karmaşık metin ve nesne ilişkilerinde daha yüksek doğruluk sağlıyor.

Yeni özellik, bilimsel diyagramlar, çizgi roman panelleri ve bilgi afişleri gibi detaylı görsel taleplerine yanıt verebiliyor. Aynı zamanda şeffaf arka planlı çıkartmalar, menüler ve logo tasarımları gibi pratik uygulamalar için de kullanılabiliyor.

OpenAI, yeni görsel üretim aracının kötüye kullanımını engellemek için çeşitli önlemler aldı. Sistem, uygunsuz içerik oluşturmayı engelliyor ve telif hakkı ihlallerine karşı koruma sağlıyor. Üretilen görsellerde doğrudan filigran bulunmasa da, C2PA meta verileriyle içeriklerin yapay zekâ tarafından oluşturulduğu belirtiliyor.

ChatGPT ile Görsel Nasıl Oluşturulur?

4o Image Generation özelliği, ChatGPT’nin ücretsiz ve ücretli tüm kullanıcılarına sunuluyor. Kullanıcılar, basit bir sohbet arayüzü üzerinden en boy oranı, renk kodu veya şeffaf arka plan gibi detayları belirterek görsel oluşturabiliyor. Geliştiriciler için API erişimi ise önümüzdeki haftalarda sağlanacak.

OpenAI’nin bu hamlesi, yapay zekâ destekli görsel üretimde yeni bir çağ başlatıyor. Kullanıcılar, hem kişisel hem de profesyonel ihtiyaçlarını karşılamak için bu yenilikçi araçtan faydalanabilecek.

ÇözümPark Haber 26/03/2025

0 1 dakika okuma süresi