IBM'in Yapay Zekası Resimleri İsimlendirebiliyor

Hızla gelişen yapay zekâ, artık resimler için başlık üretebiliyor ve resimleri isimlendirebiliyor. IBM'deki bir grup araştırmacı, resimlerin yapay zekâ yardımıyla isimlendirilmesini sağlayan bir algoritma geliştirdi.


Resimlere başlık yazmak sıkıcı ancak gerekli ve genellikle editörler tarafından sevilmeyen bir iş. Neyse ki bunu da artık yapay zekâ yapabilecekmiş gibi duruyor. Bilgisayar Görüşü ve Desen Tanıma 2019 adlı konferansta IBM’deki bir grup araştırmacı tarafından yeni bir model sunuldu. Bu model, resimlere ikna edici bir şekilde insan yapımı gibi duran, farklı ve yaratıcı başlıklar üretebiliyor.

Modeli tasarlamak kolay bir süreç değildi. Algoritma tasarlanırken otomatik başlık üretiminin ana sorununu çözmeyi gerektirdi. Bu sorun; söz dizimsel olarak doğru ancak homojen, yapay ve anlamsal olarak anlaşılmayan cümlelerin ortaya çıkmasıydı. Araştırmacılar, bu sorunu dikkat çekme modeli adını verdikleri bir modülle çözdüler. Bu modül, incelediği fotoğraftaki kareleri kullanarak cümleler oluşturmasını sağlıyor. Her oluşturma aşamasında takımın yapa zekâ modeli, bir önceki aşamadan sözlü ya da görsel işaretlerden yararlanma seçimine sahip.

Oluşturulan başlıkların fazla yapay olmasını önlemek için araştırma takımı, 'Üretken Muhalif Ağ' (GANs) adını verdikleri bir sistemden yararlandı. Bu iki parçalı ağ, örnek üreten kaynaklardan ve gerçek örnekleri oluşturulmuş örneklerden ayırmaya çalışan bir ayrıştırıcıdan oluşuyordu. Bir başka ayrıştırıcı modülü ise cümlelerin doğallığını ölçüyordu.

Algoritmanın çözmesi gereken diğer bir sorun ise aşırı uygunluktu. Aşırı uygunluk, öğrenilen objelerin görünmeyen içeriklerinde ortaya çıkmasına neden oluyordu. Yapay zekânın eğitim verisindeki bu sapmayı önlemek için araştırmacıların bir teşhis cihazı inşa etmesi gerekti. Böylelikle araştırmacılar, hangi başlıklarda aşırı uyumluluk olduğunu görebildiler.

Başlık üretme algoritması insanlı bir deneye de sokulmuş. Deneyde; insanlardan hangi başlıkların makine tarafından üretildiğini seçmeleri ve başlıkların, verilen resimlerle ne kadar ilgili olduklarını değerlendirilmesi istenmiş. Modelin deney sonucunda iyi performans sergilendiği belirtiliyor.

Araştırmacılar, “Resimlerin otomatik olarak isimlendirilmesi ve görüntü anlama özelliği, yapay zekâyı görme konusunda sıkıntısı olan insanlar için daha kullanışlı bir hâle getirecek ve onların gündelik yaşamlarını kolaylaştıracak“ şeklinde bir açıklamada da bulundu.




CİMER ve BİMER Şikayet Başvuruları Nasıl Yapılır?
CİMER ve BİMER Şikayet Başvuruları Nasıl Yapılır?

Vatandaşlar eskiden BİMER, şimdi ise CİMER ile şikayetlerini doğrudan Cumhurbaşkanlığı’na iletebiliyorlar. E-Devlet aracılığı ile de kullanılabilen sistem dışında ALO 150 hattı...

PUBG'nin Sahibine Ne Kadar Kazandırdığı Belli Oldu
PUBG'nin Sahibine Ne Kadar Kazandırdığı Belli Oldu

Şirketin açıkladığı mali raporlara göre şirkete 920 milyon dolar kazandıran oyun, 310 milyon dolar da kâr getirdi. ...

Adeta Yeniden Keşfedeceğiniz 18 Google Play Store Özelliği
Adeta Yeniden Keşfedeceğiniz 18 Google Play Store Özelliği

Android kullanan herkes Google Play Store’dan uygulama ve oyun indiriyor. Ancak Google Play Store uygulama indirmekten farklı meziyetlere de sahip. Tüm Android kullanıcılarını Google Play...