Facebook, Fotoğrafları Tanımlamak İçin Kullandığı Yapay Zekayı Geliştiriyor

Mustafa Coşkun

20/01/2021

En son gelen düzenleme ile fotoğrafları tanımlayan yapay zeka, daha fazla kavramı algılayıp tanımlayabiliyor ve daha ayrıntılı açıklamalar sağlayabiliyor.

Facebook, görme engelli kullanıcılar için sosyal ağda yayınlanan fotoğrafları tanımlamak için kullanılan yapay zeka (AI) teknolojisinde yeni geliştirmeler yaptığını duyurdu.

Otomatik alternatif metin (AAT) olarak adlandırılan teknoloji, görme engelli kullanıcıların deneyimini iyileştirmek için ilk olarak 2016 yılında Facebook tarafından tanıtılmıştı. O zamana kadar Facebook haber akışlarını kontrol eden ve bir görselle karşılaşan görme engelli kullanıcılara çok kısa açıklamalar sunabiliyordu. Kullanıcılar örnek olarak, yalnızca “fotoğraf” kelimesini ve onu paylaşan kişinin adını duyuyordu.

Daha sonra yapılan geliştirmeler ile kullanıcılar AAT ile, “görüntü şunları içerebilir: üç kişi, gülümseyen, açık havada” gibi şeyler duyabilmeye başlamıştı.

Facebook, AAT’nin en son geliştirmesi ile AI teknolojisinin bir fotoğrafta algılayabileceği ve tanımlayabileceği kavramların sayısını arttırıldığını söyledi. Bunun yanı sıra yeni AAT, “iki kişinin resmi” yerine “iki kişinin, açık havada, Eğik Pisa Kulesi” gibi önemli noktaları, etkinlikleri, yiyecek türlerini ve hayvan türlerini içeren daha ayrıntılı açıklamalar sağlayabilecek.

Şirket, teknolojinin tanıyabildiği kavram sayısının 100’den 1200’ün üzerine çıktığını duyurdu. Bunun, modelin “hem daha doğru hem de kültürel ve demografik olarak kapsayıcı” olduğunu belirttiği örnekleri kullanarak haftalık bazda eğitilmesiyle mümkün olduğunu açıkladı.

Facebook, pozisyon ve sayım hakkında daha fazla bilgi sağlamak için şirketin iki aşamalı nesne dedektörünü Facebook AI Research tarafından geliştirilen açık kaynaklı bir platform kullanarak eğittiğini de açıklamasına ekledi.

Şirket, “Bir görüntü içindeki nesnelerin konumlarını ve anlamsal etiketlerini tahmin etmek için modelleri eğittik. Çok etiketli / çoklu veri seti eğitim teknikleri, modelimizi daha geniş etiket alanıyla daha tutarlı hale getirmeye yardımcı oldu” dedi.

Geçmişte benzer çalışmalar başka firmalar tarafından da yapıldı

Geçmişte, görme engelli kullanıcılar için kullanıcı deneyimini iyileştirmek için diğer teknoloji şirketleri tarafından da benzer çalışmalar yapılmıştı.

Geçen yıl Google, kullanıcıların fiziksel bir braille klavye bağlamalarına gerek kalmadan doğrudan Android cihazlarında yazmalarına yardımcı olmak için TalkBack braille klavyesini kullanıma sunmuştu. Google daha önce de, kullanıcıların sözlü geri bildirim almak için telefonlarını nesnelere doğrultarak sesli dönüşler almasına yardımcı olmak için AI kullanan Lookout uygulamasını geliştirmişti.

Bundan da önce Amazon, evdeki eşyaları tanıyabilmesi için Echo Show’a bir Göster ve Anlat özelliği getirmişti. Kullanıcıların ellerinde tuttuklarını Alexa’ya anlattırmak için öğeyi ekrana doğru tutup “Alexa, elimde ne var?” Diye sormaları yeterli oluyordu.

Kaynak: zdnet.com

Bunlar da İlginizi Çekebilir

Microsoft Defender, Saldırılara Karşı Daha Güçlü Hale Geliyor
Qualcomm Snapdragon 870 İşlemcisini Duyurdu
DNS Kayıtlarında Güvenlik Açığı