Yapay Zeka, Sesleri Görsele Dönüştürerek Şehir Manzaralarını Yeniden Oluşturuyor
Teksas Üniversitesi araştırmacıları, yapay zekâ kullanarak ses kayıtlarını sokak görüntülerine dönüştürmeyi başardı. Bu yenilikçi çalışma, insan duyusal algılarını taklit eden sistemlerin geliştirilmesinde önemli bir adım olarak değerlendiriliyor. Yapay zekâ modelleri, seslerden yola çıkarak sokak manzaralarını görselleştirme yeteneğiyle, seslerin görsel karşılıklarını yüksek doğruluk oranlarıyla sunabiliyor.
Seslerin Görüntüye Dönüşebilmesi İçin Birçok Veri Kullanıldı
Teksas Üniversitesi araştırma ekibi, “Computers, Environment and Urban Systems” dergisinde yayımladıkları çalışmada, ses manzaralarını görsel verilere dönüştürmek için geliştirilen bir yapay zekâ modelinin detaylarını paylaştı. Çalışma kapsamında, farklı coğrafi bölgelerden (Kuzey Amerika, Asya ve Avrupa) toplanan ses ve görüntü çiftleri kullanıldı. 10 saniyelik ses klipleri ile eşleşen görseller, yapay zekâ modelinin eğitiminde kullanılarak seslerin görsel karşılıklarını oluşturan bir sistem geliştirildi.
Araştırma, yapay zekâ tarafından oluşturulan görüntülerin, gerçek dünyadaki görsellerle büyük ölçüde örtüştüğünü gösterdi. İnsan katılımcılar, %80 oranında doğru tahmin yaparak ses kayıtlarına uygun görselleri seçmeyi başardı. Ayrıca, sistemin oluşturduğu görsellerde gökyüzü, bitki örtüsü ve binaların oranları gerçeğe yakın olarak sunuldu.
Araştırmanın başyazarı Yuhao Kang, bu çalışmanın yapay zekâ teknolojilerinin, insan duyusal deneyimlerini taklit etme potansiyelini ortaya koyduğunu ifade etti. Kang’a göre, seslerin görsellerle eşleştirilmesi, yalnızca fiziksel çevreyi tanımlamakla kalmayıp, aynı zamanda insanın bir mekâna dair algılarını zenginleştirebilir.
Araştırmacılar, bu sistemin mimari stil, ışık koşulları ve objeler arası mesafeler gibi detayları da doğru bir şekilde yansıttığını belirtiyor. Örneğin, gece veya gündüz gibi zaman bilgileri, ortam seslerindeki farklılıklarla tespit edilebiliyor. Bu gelişmeler, seslerden elde edilen görsellerin çok boyutlu bir deneyim sunabileceğini gösteriyor.
Bu yenilikçi çalışmayla yapay zeka, insanların çevreyle olan etkileşimini daha derinlemesine anlamaya yardımcı olabilir. Kang ve ekibi, bu teknolojinin şehirlerin kimliklerini anlamak gibi daha geniş çaplı uygulamalara da olanak sağlayabileceğini ifade ediyor.