OpenAI’nin Kurgusal Yapay Zekası Görüntü Üretmeyi Öğreniyor

Geçen yılın Şubat ayında, San Francisco merkezli araştırma laboratuvarı OpenAI, AI sisteminin şimdi ikna edici İngilizce pasajlar yazabileceğini duyurdu. Kurgusal yapay zeka, bir cümlenin veya paragrafın başlangıcını, denildiği gibi neredeyse insan benzeri tutarlılıkla devam ettirebilir.

Şimdi laboratuvar, aynı algoritma bunun yerine görüntünün bir kısmına beslenirse ne olacağını araştırıyor. Bu haftanın Uluslararası Makine Öğrenimi Konferansı’nda en iyi makale için onurlu bir söz verilen sonuçlar , fırsat ve sonuçlarla olgunlaşan görüntü üretimi için yeni bir yol açıyor.

Özünde, GPT-2 güçlü bir tahmin motorudur. İnternetin köşelerinden çıkarılan milyarlarca kelime, cümle ve paragraf örneğine bakarak İngiliz dilinin yapısını kavramayı öğrendi. Bu yapı ile, söz konusu kelimelerin görünme sırasını istatistiksel olarak tahmin ederek yeni cümleler haline getirebiliyor.

Bu yüzden OpenAI’daki araştırmacılar, derin öğrenme için en popüler görüntü bankası olan ImageNet’te pikseller için kelimeleri değiştirmeye ve aynı algoritmayı görüntüler üzerinde eğitmeye karar verdi. Algoritma tek boyutlu verilerle (yani metin dizeleri) çalışacak şekilde tasarlandığından, görüntüleri tek bir piksel dizisine dönüştürdü. İGPT adlı yeni modelin görsel dünyanın iki boyutlu yapılarını hala kavrayabildiğini keşfettiler. Görüntünün ilk yarısı için piksel dizisi göz önüne alındığında, ikinci yarıyı bir insanın mantıklı olacağı şekilde tahmin edebilir.

Aşağıda birkaç örnek görebilirsiniz. En soldaki sütun girdi, en sağdaki sütun orijinal ve orta sütunlar iGPT’nin öngörülen tamamlamalarıdır. (Daha fazla örneği burada görebilirsiniz .)

Sonuçlar şaşırtıcı derecede etkileyici. 2000’lerin ortalarındaki ilk bilgisayar görme sistemleri bu tür teknikleri daha önce denemiş olsa da, etiketli verileri kullanan denetimli öğrenme çok daha başarılı olduğunu kanıtladılar. Bununla birlikte, gözetimsiz öğrenmenin yararı, bir AI sisteminin bir insan filtresi olmadan dünyayı öğrenmesine izin vermesi ve verileri etiketlemenin manuel işçiliğini önemli ölçüde azaltmasıdır.

İGPT’nin GPT-2 ile aynı algoritmayı kullanması da ümit vaat eden uyumluluğunu göstermektedir. Bu, OpenAI’nin daha genelleştirilebilir makine istihbaratı elde etme konusundaki nihai tutkusunu göstermektedir.

Aynı zamanda bu yöntem, deepfake görüntüleri oluşturmak için yeni bir yol sunuyor. Geçmişte deepfakes oluşturmak için kullanılan en yaygın algoritma kategorisi olan jeneratif rakip ağlar , yüksek düzeyde küratörlü veriler konusunda eğitilebilir. Örneğin, bir yüz oluşturmak için bir GAN almak istiyorsanız, eğitim verilerinin yalnızca yüzleri içermesi gerekir. iGPT, aksine, görsel dünyanın yapısını, milyonlarca ve milyarlarca örnekte yeterince öğrenir ve içinde mümkün olan var olan görüntüleri gösterir.

Bu ve buna benzer içeriklerimize sosyal medya hesaplarınızdan ulaşmak isterseniz, bizi youtube ve instagram hesaplarımızdan takip edebilirsiniz.

Latest posts by Burakhan Gögce (see all)

Burakhan Gögce

Burakhan Gögce

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir