• SANAT
  • 9 SORUDA
  • DİKEN ÖZEL
  • GÜNÜN 11'i
  • DİKENLİK
  • AKŞAM POSTASI
  • SPOR
  • VPN HABER

Diken

Yaramazlara biraz batar!

  • VİTRİN
  • AKTÜEL
  • EKONOMİ
  • ANALİZ
  • DÜNYA
  • MEDYA
  • KEYİF
  • YAZARLAR
  • SÜRDÜRÜLEBİLİRLİK

OpenAI, bir milyon saatten fazla YouTube videosuyla GPT-4'ü gizlice eğitti

12/04/2024 15:34

OpenAI, hiçbir izin almadan bir milyon saatten fazla metne çevrilmiş YouTube videosuyla GPT-4’ü gizlice eğitti. 

Görsel: Canva

Geçtiğimiz ay Wall Street Journal’dan Joanna Stern ve OpenAI CTO’su Mira Murati şirketin en son metinden videoya dönüştürme aracı Sora’yı konuşmak için bir araya geldi. Sohbet sırasında Stern, Murati’ye Sora’nın YouTube, Instagram ve Facebook’taki videoları kullanarak eğitim alıp almadığını sordu ve Murati “Kamuya açık verileri ve lisanslı verileri kullandık” dedi. Stern “Peki YouTube’daki videolar?” diye üstelediğindeyse Murati yüzünü buruşturup “Aslında bundan emin değilim” sözleriyle karşılık verdi. 


OpenAI CTO’su Mira Murati, gazetecinin sorusuna yanıt vermekte zorlandı.

CTO’nun bu sorudan rahatsız olması şaşırtıcı değil. Çünkü New York Times’ın haberini yaptığı üzere Open AI, GPT-4 büyük dil modelini (LLM) bir milyondan fazla YouTube videosuyla gizlice eğitti. Kaynaklar gazeteye, transkriptlerin GPT-4’e aktarıldığını söyledi.

Üstelik bunu yapan sadece OpenAI değil. YouTube’un sahibi Google da kendi yapay zeka modellerini eğitmek için transkriptleri topladı. 

Bu durum, yapay zeka şirketlerinin modellerini eğitmek için telif haklarını sorgusuzca nasıl ihlal ettiklerini gösteriyor ve bu şirketler izin almak bir yana hak sahiplerine adil bir tazminat bile ödemiyor. Konu hakkında makale yayınlayan NYT’nin kendisi bile OpenAI ve Microsoft’a karşı onları telif hakkı ihlaliyle suçalayan bir davayla uğraşıyor. 

Google sözcüsü Matt Bryant, NYT’ye YouTube’un ‘YouTube içeriğinin izinsiz olarak kopyalanmasını ya da indirilmesini’ yasakladığını söyledi. Bir başka röportajındaysa şirketin OpenAI faaliyetlerine ilişkin ‘doğrulanmamış raporlar’ gördüğünü belirtti. 

Ancak asıl soru, bir milyon saatlik YouTube videosunun izinsiz kopyalamanın hırsızlık anlamına gelip gelmediği. ABD’deki telif hakkı yasası, özellikle adil kullanım söz konusu olduğunda yasal olarak gri bir alanda kalmaya devam ediyor. Uzmanlar ve avukatlar ise yapay zeka şirketlerinin internetin tamamında dolaşırken tüm içeriği lisanslamanın muhtemelen imkansız olacağını söylüyor. 

Yapay zeka şirketleri verileri fütursuzca kullanmaya devam etse de yakında çok da ilginç bir sorunla karşı karşıya kalacak gibi görünüyor: Eğitim verilerinin tükenmesi. 

Araştırmacılar, 2026’ya kadar yapay zeka şirketlerinin modellerini besleyecek yüksek kaliteli verilerin tükenme ihtimalinin yüzde 90 olduğunu söylüyor.

Kategori:Diken'e takılanlar, Vitrin-mobil

SON HABERLER

Üç kez kapatılmıştı: CHP'nin dördüncü boykot sitesi yayında

CHP, boykot sitesine üçüncü kez erişim engeli getirilmesinin ardından ‘boykotyap2025.com’ sitesinin yayına girdiğini duyurdu.

Yılmaz Özdil hakkında soruşturma

Gazeteci-yazar Yılmaz Özdil hakkında ‘Türkiye Cumhuriyeti devletini hedef alan veya aşağılayıcı paylaşımı’ nedeniyle resen soruşturma başlatıldı.

Beylikdüzü'nde metrobüs kazası: Şoför tutuklandı

Beylikdüzü’nde bir kişinin öldüğü metrobüs kazasında gözaltına alınan şoför tutuklandı.

Brezilya Milli Takımı Carlo Ancelotti'yle anlaştı

Brezilya Milli Takımı, İtalyan teknik direktör Carlo Ancelotti’yle anlaştı.

Hamas, ABD-İsrail vatandaşı esiri serbest bıraktı

Hamas’ın ABD’yle doğrudan görüşmeleri neticesinde Gazze’deki ABD-İsrail çifte vatandaşı esir asker, Kızılhaç heyetine teslim edilerek serbest bırakıldı.

Akşener'den YSK'ya tepki: 'Hırsızların masasına haram olarak sundu'
Satılan her 10 otomobilden dokuzu otomatik vitesli

Ara

DİKEN’İ TAKİP EDİN

Osman Kavala 2 bin 750 gündür hapiste

YAZARLAR

Yeşil zeytini neden yemedin Sait?

Ayhan Tinin

Editör eksikliği fazlalık yaratır

Mustafa Dağıstanlı

Anne dediğin başlangıçtır

Psk. Dr. Feyza Bayraktar

Dilsiz bir ülkenin çığlığı

Psk. Dr. Feyza Bayraktar

Sırrı Süreyya Önder'in 'Cumhuriyet' eleştirisi üzerine…

Murat Sevinç

Silmek isteseler de silemezler

Psk. Dr. Feyza Bayraktar

Füruzan'ın röportajlarındaki dil dikenleri

Mustafa Dağıstanlı

GÜNÜN 11’İ

Alaattin Aktaş: 'Şak diye 10 milyar döviz satma' önerisi acaba 'şak' kısmı aynı kalmak kaydıyla faiz artışında uygulansaydı…

Murat Muratoğlu: 'Dış mihrak', 'üst akıl', 'iç hain' derken şimdi de repertuara 'malum çevreler' eklendi

Abdullah Tolu: Büyük şirketler futbol kulüplerinin statlarında loca kiralayarak, müşterileri ve personelini ağırlıyor

Yusuf Dinç: Politika faizini, enflasyonu bahane edip kura göre ayarlamaktan vazgeçilmeli…

Engin Solakoğlu: ABD'nin Ortadoğu'da yeniden çizmeye kalkıştığı harita bakımından Türkiye'nin önemi eşsiz

Erdal Sağlam: Bu iktidarın enflasyonu tek haneye indiremeyeceği çok açık

Ünal Özüak: Malaga ligin en iyi takımı olabilir ama Galatasaray daha motive olmalıydı

Abbas Güçlü: Çin, başta ABD olmak üzere diğerlerine hiç benzemiyor!

Nuray Babacan: Temkinli duran AKP'li siyasetçiler var

Murat Belge: İki çocuğunu öldürmüş 'vatanperver'le aynı safta yer almak 'bütün' AKP sempatizanlarını mutlu eder mi?

Faruk Bildirici: Haberi düzeltmesi, istismarın ayrıntılarının pornografik bir dille anlatıldığı satırları silmesi gerekirdi

  • 9 SORUDA
  • YAZARLAR
  • AKTÜEL
  • ANALİZ
  • DİKEN ÖZEL
  • DİKEN'E TAKILANLAR
  • DÜNYA
  • EKONOMİ
  • KEYİF
  • MEDYA
  • POPÜLER BİLİM
  • SANAT
  • BU GAZETE…
  • DİKEN 10 YAŞINDA
  • Künye
  • İletişim
  • Gizlilik ilkeleri
  • Çerez politikası

"Genç gazeteci arkadaşlarıma! Bu meslek yorucu bir meslektir. Ama, insan büyük bir zevkle çalışır. Kalemine daima efendi kal, uşak olmamaya gayret et. Mecbur kalırsan kır, sakın satma." Sedat Simavi

×