ZEYNEP GÜVEN ÜNLÜ
@zeynepguvenunlu
zeynepguven@diken.com.tr
Saygın ekonomi dergisi The Economist, 11-17 Haziran kapağındaki robotu bağımsız yapay zeka laboratuvarı Midjourney’de yaptı. Cosmopolitan, Temmuz sayısının kapağında kullandığı ‘ayda yürüyen astronot’u Open AI‘ın geliştirdiği Dall-e 2 ile hazırladı.


Haydi, Diken’i de söyleyelim: 9 Temmuz günü yayınladığımız ‘İki yaşındaki çocuk kendisini ısıran yılanı’ ısırdı haberinde etik ilkeler gereği küçük çocuğun fotoğrafını kullanmadık. Temsili olarak elinde yılan tutan hiperrealistik küçük çocuk resmini Dall-e 2’de hazırladık.
Bu yazıya eşlik eden görselleri de Midjourney ya da Dall-e 2’yle 10’ar saniyede ürettik.
Bazılarını sanatçı Bager Akbay bizim için üretti. Midjourney’ye ‘Altın tahtta oturan keçi kral’ yazdı, stil olarak da ‘majestik, ditijal’ komutunu verdi. Program (henüz) Türkçe bilmediği için bunu İngilizce kullandı (A goat king sitting on a golden throne majestic digital). Sağ alttaki görsel için de ’55 yaşında, geniş alınlı, uzun saç kesimli adam’ komutunu verdi.

Bager Akbay bu konuyu konuşmak için Türkiye’deki en doğru isim. Sağlam bir matematik eğitimi aldığı İstanbul Atatürk Fen Lisesi’ni bitirdi. Sonrasında tasarım okudu. Yapay zekayı anlamak için yeterli altyapıya sahip. Sadece anlamakla kalmıyor, iş de üretiyor.
2015’te Deniz Yılmaz adlı bir robot-şair yarattı. Instagram’da yaşayan robot-influencer Aypera da onun eseri. Kavramsal sanatla ve sanat eğitimiyle ilgileniyor.
Bager Akbay, ‘metni görsele dönüştüren bilgisayar programlarının arkasındaki teknolojiyi ve mantığı’ basit şekilde açıkladı. Sanat alanında nasıl bir dönüşümün eşiğinde olduğumuzu anlattı.
Dall-e 2, Midjourney… İki kelime yazıyorsunuz ve 10 saniyede size çarpıcı bir dünya sunuyor. Bu nasıl oluyor?
Son dönemde yapay zekanın imkanları istatistiksel öğrenme ve büyük data internet sayesinde çok genişledi.
Örnek vereyim. Eskiden yapay zekaya satrancı öğretirken oyunun kurallarını öğretiyorduk. Uzman sistemler vardı ve o kurallarla işlem yapıyorlardı.
Sonra istatistiksel modellere geçmeye başladık, yani uzmandan veri bilimine doğru geçtik. 2014’ten itibaren yapay zeka birçok yerde aktif olmaya başladı.
Metin üretme araçları çıktı. Mesela ‘ekoloji sanat ve teknoloji üzerine bize küratöryel bir metin yaz’ dediğimizde yazabilen bir yapay zeka var.
Ya da ‘bir ortaokul öğrencisinin anlayacağı şekilde jüpiteri anlat’ dediğimizde bunun yapan yapay zeka var. Dolayısıyla burada bir sürü şaşırtıcı beceri oluştu.
Bunun görsel üretimde yaygınlaşması Google’ın ‘deep dream’ programıyla başladı. Dall-e’nin ilk versiyonu da basit bir şekilde cümleyi resme çevirebiliyordu.
Şimdi Midjourney ve Dall-e 2 ile işler hepimizi şaşırtacak kadar ilerledi.
Peki iki kelimeden nasıl görsel üretiyor yapay zeka? O resimler nereden geliyor?
İnsanlar kolaj yapıyordur herhalde diye düşünüyor, yani internetten bulup onları birleştiriyor diye düşünüyor. Ama öyle değil. Dall-e 2’de durum şu: Program kabaca pandanın ne olduğunu biliyor. Gitarın ne olduğunu biliyor. Gitar çalmanın ne olduğunu biliyor. ‘Gitar çalan panda, yağlıboya’ dediğinde bunlari birleştirebiliyor.
Bunları nereden alıp birleştiriyor?
Basitçe anlatmaya çalışayım. Resimlerin ve açıklamalarının milyarlarcasını sisteme verdiler ve sonra yapay zekaya bunun tersini yaptırdılar. Yani resimden açıklama değil, açıklamadan resim yapmaya başladı. Sonra onun yeteneklerine odaklandılar, onu geliştirdiler.
Yine günlük hayattan bir örnek.
Ben bilgisayara tarhana çorbası tariflerini değil insanların tarhana çorbası yapma deneyimini kaydediyorum.
Bütün evlerdeki tarhana çorbası yapılma şekillerini kaydediyorum. Milyonlarca tarhana çorbası yapılmasını görüyorum. Ve diyorum ki bunların hepsini tarife dönüştür. Milyon tane tarif oluyor. Sonra diyorum ki bu tarifleri analiz et ve bu tarifler gibi tarifler üret. Yani meta bir işe çıkıyor.
Yapay zekaya işin nasıl yapılacağını anlatmıyorum, ‘sen işin nasıl yapılacağına bak, anlayıp bul’ diyorum. Burada artık insanın hakimiyeti çok azalıyor. Doğrusu ben de artık anlamakta zorlanıyorum. Beni bırakın yapay zekayı kodlayan da ‘niye bunu yapıyor’ sorunun cevabını veremeyebiliyor.

Sanat tarihi hiç olmadığı kadar popüler
Midjourney gibi programlardaki üretimimize ne diyeceğiz? İnternet eğlencesi mi, sanat mı, tasarım mı?
Sanat olup olmadığıyla ilgili bir şey söylemek için erken ama insanları resimle yakınlaştırdığı kesin. Geçenlerde biri, ‘ya farkında mısınız Dall-e 2 ve Midjourney yüzünden millet sanat tarihi çalışmaya başladı’ dedi. Şu an sanat tarihi hiç olmadığı kadar popüler. Çünkü komut verebilmek için sanatı ve sanat tarihini biraz bilmek gerekiyor.
Şimdilik sanattan çok tasarımla, üretimle, demokratikleşmeyle ilgili bir şeyler var burada.
Hiç anlatılmamış hikayeler anlatmak mümkün. Mesela sanat tarihindeki bütün resimleri siyahlar üzerinden yeniden yorumlamak. Bunu kolayca yapmak mümkün bu programlarda.
Midjourney, Dall-e 2 ve benzerleri kimleri ya da hangi sektörleri tehdit ediyor?
Bir resim yapılacaksa resmi isteyen resmi yapacak olana ne istediğini anlatır. Bir de ressam ya da photoshop operatörü vardır, o da onu uygular. Şimdi acaba aradaki o operatörü ortadan kaldırabilir miyiz diye düşünmek mümkün.
Şu anda elbette değil ama olabileceğine dair ipuçları da var.
20’nci yüzyılda mavi yakaya saldırdık, şimdi beyaz yakaya saldırıyoruz
Resim ve photoshop yapanlar yapanlar işsiz kalacak o zaman.
Alandaki dünya çapında iş yapan arkadaşlarla tartıştık ve dedikleri şu: ‘Bu programlar metin yazarıyla kreatif direktörün birleşip art direktörün ayağını kaydırması için yapılmış gibi.’
Şaka bir yana, imaj bankalarını, Pinterest gibi platformları kesinlikle tehdit ediyor. Aslında bugünün teknolojik gelişmeleri genel olarak bütün beyaz yaka dünyasını tehdit ediyor.
20’nci yüzyıl mühendislik yüzyılıydı. Bulaşık yıkamayalım, makine yıkasın. Fırın yakmayalım, elektrikli fırın pişirsin. Mavi yakaya saldırdık. Hala iş yapılıyor tabii ama işgücü ucuzladı.
21’inci yüzyıl yüksek teknoloji yüzyılı. Bütün alanlar beyaz yakaya saldırıyor. Şu dönem beyaz yaka işlerin otomasyona döndüğü bir zamandayız. Yine beyaz yaka işler kalacak ama daha ucuza çalışıyor olacağız.
Ama fikir bulmak, moodboard yapmak, esinlenmek için çok iyi bir kaynak.



Bütün dünyanın hayal gücü bir araya toplanmış gibi.
Bu güzel bir cümle ama bundan çok emin değilim. Toplanmak dediğimiz bir eylem, toplanınca herkes temsil ediliyor gibi düşünüyoruz. Halbulki özetlenmiş ve ortalaması alınmış bir birikim var orada. Bu da arkadaki ideolojik durumu gösteriyor.
Ayna gibi geliyor bana. Biz sirkteyiz, sihirli aynalar sunmuşlar bize. Bakıp ‘aaa çok ilginç görünüyor’ diyoruz. O bizim sanatçıyı algılama şeklimizi kültürümüzü yansıtıyor. Toplanma kelimesi biraz fazla idealist bir yaklaşım. Toplanma olması için farklı yapay zeka algoritmalarının da birleşmesi lazım. Hatta, The Master Algorithm kitabının yazarı Petro Domingos’un bir eleştirisi var: “Bir sürü yapay zeka modeli var ve biz yanlış modeli örnek alıyoruz” diyor.
Yani bizi aynalayan bir modeli örnek alıyoruz. Dolayısıyla bizim hatalarımızı da aynalıyor. Yani biz ayrımcıysak o da ayrımcı oluyor. Şimdi değiştirmeye çalışıyorlar bunu.
Bager Akbay’la söyleşimiz yarın da devam ediyor. ‘Yapay zeka tabanlı bu programların sanatı, sanat eğitimini nasıl etkileyeceğini’ konuşacağız. ‘İstanbul’da ekonomik kriz’, ‘iklim krizi’ gibi anahtar kelimelerle nasıl resimler elde ettiğimizi de yarın göreceğiz.