Google, Görsellerle Çalışan Yeni Yapay Zeka Aracı Whisk’i Kullanıma Sundu
Google, yapay zekâ alanındaki yeniliklerine bir yenisini daha ekledi. Şirketin yeni deneysel aracı Whisk, görselleri temel alarak yapay zekâ destekli görüntüler oluşturmanıza olanak tanıyor. Metin tabanlı komut yerine görsel girdi kullanarak hızlı ve eğlenceli bir üretim süreci sunuyor.
Whisk Nasıl Çalışıyor?
Kullanıcılar, Whisk’e birden fazla görsel yükleyebiliyor. Bu görseller; konu, stil ve sahne gibi farklı unsurları tanımlamak için kullanılıyor. Google, yüklenen görsellerden arka planda bir metin komutu oluşturuyor ve bu veriyi Imagen 3 modeline iletiyor.
Imagen 3, bu yıl piyasaya sürülen ve Google’ın en yüksek kalitedeki görsel üretim modeli olarak tanımladığı yapay zekâ modeli. Şirket, bu modelin detayları, ışıklandırması ve görsel kalitesi bakımından önceki modellere göre çok daha başarılı olduğunu belirtiyor.
Google, Whisk’in tam anlamıyla görseldeki unsurları kopyalamadığını vurguluyor. Aracın amacı, görselin özünü yakalamak. Bu nedenle oluşturulan görsellerde, orijinal görselden farklı cilt tonu, saç stili veya boy gibi detaylar görülebiliyor. Ancak kullanıcılar, bu eksiklikleri gidermek için arka planda oluşturulan metin komutunu düzenleyebiliyor.
Whisk, geleneksel bir görüntü düzenleme aracı değil; daha çok yaratıcılığı teşvik eden bir platform olarak öne çıkıyor. Kullanıcılar oluşturulan görselleri indirerek projelerinde kullanabiliyor.
Şu an için Google Whisk, yalnızca ABD’deki Google Labs programına katılan kullanıcılar tarafından erişilebilir durumda. Google Labs, şirketin deneysel yapay zekâ özelliklerini denemek isteyen kullanıcılara erken erişim sunuyor.