ChatGPT, GPT-4 ve diğer büyük dil modelleri teknoloji gündemini etkisine atlına almışken metinde görsele üretken yapay zeka araçlarındaki gelişim de Midjourney v5 ile inanılmaz seviyelere uzandı.
Geçtiğimiz günlerde Midjourney, kendi adını taşıyan yapay zeka üretme aracının 5. sürümünü beta olarak yayınladı. Twitter üzerinden yapılan duyuruda son versiyonun çok daha gelişmiş görsel kalitesi, daha çeşitli sonuçlar, daha geniş stil yelpazesi, kusursuz dokular ve diğer iyileştirmelere sahip olduğu belirtildi. Bu söylemler kağıt üzerinde anlaşılamayacak öneme sahip diyebiliriz zira Midjourney v5 ile üretilen görseller kelimenin tam anlamıyla “inanılmaz” bir seviyeye ulaşmış durumda.
Midjourney, v4 sürümünde zaten harika sonuçlar ortaya koysa da çoğu zaman eller ve gözler kısmında zorluk yaşıyordu. Bir manzara resmi istediğinizde evet, sonuçlar mükemmel ancak bir insan resmi istediğinizde eller ve yüz kısmında zaman zaman bozulmalar yaşanıyordu. Yeni sürüm de yapay zeka artık çok daha gelişmiş durumda. Bu nedenle eller ve yüz hatları son derece gerçekçi. Oluşturulan görseller o kadar gerçekçi ki çoğu zaman bunların harika bir fotoğrafçı tarafından çekildiğini düşünüyorsunuz.
Fark çok büyük
Midjourney v5 ile AI sanat meraklıları da bölünmüş durumda. Ancak bu fikir ayrılığı yeni sürümün kötü olmasından değil, aksine çok başarılı olmasından kaynaklanıyor. Bazı yorumcular yeni sürüm hakkında “korkutucu” ve “fazla mükemmel” ifadelerini kullanırken diğerleri hayranlıklarını gizleyemedi. Önceki sürümler ile son sürüm arasındaki farkı hemen alttaki görselden görebilirsiniz. Bu görselin üretilmesi için aynı istem kullanıldı: “CRT televizyon setinin yanında silahları olan kaslı bir barbar, sinematik, 8K, stüdyo aydınlatması”
Ürkütücü faktör bir yana, V4 ile karşılaştırıldığında Midjourney v5’in kalitesi önemli ölçüde artmış. Grafik tasarımcı Julie Wieland bir süredir Midjourney v4’ü (geçtiğimiz Kasım ayında yayınlandı) kullanıyor ve sürüm 5’in “inanılmaz derecede gerçekçi” cilt dokularına sahip olduğunu söylüyor. Yansımalar, parlamalar ve gölgeler de dahil olmak üzere ışık efektleri de çok daha iyi. Belki de en önemlisi, yapay zeka çoğu zaman doğal görünen eller ve gözler üretiyor.
Midjourney v5, sanki uzunca bir süre gözlüğünüzü takmayıp ardından tekrar gözlüğünüzü takmışsınız gibi. Bununla birlikte yeni sürüm doğal çözünürlüğü 512×512 pikselden 1024×1024 piksele yükseltti. Ek olarak bu nedenle görüntülerin oluşturulması öncekine kıyasla biraz daha vakit alıyor. Midjourney, tıpkı Stable Diffusion ve DALL-E gibi görüntü sentezleyiciler gibi çalışıyor ve milyonlarca insan yapımı sanat eseri üzerinde eğitilmiş bir yapay zeka modeli kullanarak “istemler” adı verilen metin açıklamalarına dayalı görüntüler üretiyor
Midjourney v5 ile üretilen bazı resimler
Kaynak: DonanimHaber