IBM'in Yapay Zekası Resimleri İsimlendirebiliyor

Hızla gelişen yapay zekâ, artık resimler için başlık üretebiliyor ve resimleri isimlendirebiliyor. IBM'deki bir grup araştırmacı, resimlerin yapay zekâ yardımıyla isimlendirilmesini sağlayan bir algoritma geliştirdi.


Resimlere başlık yazmak sıkıcı ancak gerekli ve genellikle editörler tarafından sevilmeyen bir iş. Neyse ki bunu da artık yapay zekâ yapabilecekmiş gibi duruyor. Bilgisayar Görüşü ve Desen Tanıma 2019 adlı konferansta IBM’deki bir grup araştırmacı tarafından yeni bir model sunuldu. Bu model, resimlere ikna edici bir şekilde insan yapımı gibi duran, farklı ve yaratıcı başlıklar üretebiliyor.

Modeli tasarlamak kolay bir süreç değildi. Algoritma tasarlanırken otomatik başlık üretiminin ana sorununu çözmeyi gerektirdi. Bu sorun; söz dizimsel olarak doğru ancak homojen, yapay ve anlamsal olarak anlaşılmayan cümlelerin ortaya çıkmasıydı. Araştırmacılar, bu sorunu dikkat çekme modeli adını verdikleri bir modülle çözdüler. Bu modül, incelediği fotoğraftaki kareleri kullanarak cümleler oluşturmasını sağlıyor. Her oluşturma aşamasında takımın yapa zekâ modeli, bir önceki aşamadan sözlü ya da görsel işaretlerden yararlanma seçimine sahip.

Oluşturulan başlıkların fazla yapay olmasını önlemek için araştırma takımı, 'Üretken Muhalif Ağ' (GANs) adını verdikleri bir sistemden yararlandı. Bu iki parçalı ağ, örnek üreten kaynaklardan ve gerçek örnekleri oluşturulmuş örneklerden ayırmaya çalışan bir ayrıştırıcıdan oluşuyordu. Bir başka ayrıştırıcı modülü ise cümlelerin doğallığını ölçüyordu.

Algoritmanın çözmesi gereken diğer bir sorun ise aşırı uygunluktu. Aşırı uygunluk, öğrenilen objelerin görünmeyen içeriklerinde ortaya çıkmasına neden oluyordu. Yapay zekânın eğitim verisindeki bu sapmayı önlemek için araştırmacıların bir teşhis cihazı inşa etmesi gerekti. Böylelikle araştırmacılar, hangi başlıklarda aşırı uyumluluk olduğunu görebildiler.

Başlık üretme algoritması insanlı bir deneye de sokulmuş. Deneyde; insanlardan hangi başlıkların makine tarafından üretildiğini seçmeleri ve başlıkların, verilen resimlerle ne kadar ilgili olduklarını değerlendirilmesi istenmiş. Modelin deney sonucunda iyi performans sergilendiği belirtiliyor.

Araştırmacılar, “Resimlerin otomatik olarak isimlendirilmesi ve görüntü anlama özelliği, yapay zekâyı görme konusunda sıkıntısı olan insanlar için daha kullanışlı bir hâle getirecek ve onların gündelik yaşamlarını kolaylaştıracak“ şeklinde bir açıklamada da bulundu.




DJI RS 2 ve RSC 2 El Tipi Gimballeri Resmi Olarak Piyasaya Sürüldü; Fiyat 499 Dolardan Başlıyor
DJI RS 2 ve RSC 2 El Tipi Gimballeri Resmi Olarak Piyasaya Sürüldü; Fiyat 499 Dolardan Başlıyor

Drone üreticisi DJI bugün resmen iki yeni gimbal piyasaya sürdü  bunlar- RS 2 ve RSC 2. Görünüşe göre şirket Ronin serisini daha kısa isimler için yeniden markalaştırdı. Her ikisi de...

Fortnite'a Yeni Silah Geliyor: Şişe Roketi
Fortnite'a Yeni Silah Geliyor: Şişe Roketi

Battle Royale türünde başı çeken oyunlardan olan Fortnite, yepyeni bir 'yere sabitlenip kullanılabilen roket'e sahip oluyor. ...

346 kişiye mezar olan Boeing 737 Max, ABD’de havalandı 2020
346 kişiye mezar olan Boeing 737 Max, ABD’de havalandı 2020

Uçuş kontrol sistemindeki arıza sebebiyle 346 kişinin ölümüne kapı aralayan Boeing 737 MAX uçağı, 2018 ve 2019 senelerinde iki korkunç kazaya karışmıştı. Etiyopya’daki kazanın...