Menu
in ,

Yapay Zekâ İnternetin Yazılı Bilgisini 2026’ya Kadar Tüketip Özel Veri Kaynaklarına Yönelebilir

Yapay zekânın bilgi açlığı dinmek bilmiyor. Yeni bir araştırma YZ’nin 2026’ya kadar internetin tüm yazılı verilerini tüketeceğini ortaya koyuyor.

Araştırmacılar, yapay zekâ modellerinin önümüzdeki birkaç yıl içinde internet üzerindeki tüm yazılı bilgileri tüketebileceği konusunda uyarıyor. Söz konusu durum şirketlerin daha iyi modeller oluşturmak için özel verilere başvurmak zorunda kalabileceği anlamına geliyor ki, bu da birtakım endişeleri beraberinde getiriyor.

Yapay zekâ sistemlerinin hızla gelişmesi, beraberinde büyük veri ihtiyacını da getiriyor. GPT-4 gibi ileri düzey dil modelleri, internetin derinliklerinde yer alan milyarlarca kelimeyi kullanarak öğrenme süreçlerini sürdürüyor. Ancak yeni bir araştırma, bu veri kaynağının 2026 gibi yakın bir tarihte tükeneceğini öne sürüyor. Kısaca, teknoloji dünyasında yeni ve potansiyel olarak tartışmalı bir dönemi başlatabilir.

Epoch AI araştırma enstitüsünden Pablo Villalobos ve ekibi tarafından yapılan ve arXiv’de yayımlanan yeni bir çalışma, ChatGPT’yi besleyen GPT-4 veya Claude 3 Opus gibi yapay zekâ modellerinin 2026 ile 2032 yılları arasında internetteki halka açık tüm veri kaynaklarını tüketebileceğini öngörüyor.

- Reklam -

Yapay zekâ sistemleri, gelişmek için çevrimiçi paylaşılan trilyonlarca kelimeye ihtiyaç duyuyor. Ancak araştırmacıların projeksiyonlarına göre önümüzdeki yıllarda yüksek kaliteli veriler tükenecek. Bu da teknoloji şirketlerini sentetik veri üretmeye, daha düşük kaliteli kaynaklara yönelmeye veya en kötü ihtimalle özel sunuculardaki mesaj ve e-postaları işlemeye itebilir.

Teknoloji Dünyasında Yeni Bir Dönem Başlıyor: Yapay Zekâ İnternetin Yazılı Bilgisini Tüketmek Üzere

Villalobos şunları söylüyor:

“Sohbet robotları mevcut tüm verileri tüketirse ve veri verimliliğinde herhangi bir ilerleme kaydedilmezse, alanda bir durgunluk görmeyi beklerim. Modeller, yeni algoritmik içgörüler keşfedildikçe ve yeni veriler üretildikçe yavaş yavaş gelişecektir.”

Araştırmacılar, internetteki mevcut veri stoklarını hesaplamak için Google’ın web endeksini kullandı. Sonuçlar, güvenilir kaynaklardan alınan yüksek kaliteli bilgilerin en geç 2032’ye kadar tükeneceğini, düşük kaliteli verilerin ise 2030-2050 arasında bitebileceğini ortaya koydu. Görüntü verilerinin ise 2030-2060 yılları arasında tamamen tükenebileceği tahmin ediliyor.

Veri kıtlığının derin öğrenme modellerinin ilerlemesini yavaşlatıp yavaşlatmayacağı ise henüz belirsiz. Ancak Villalobos bu durumun büyük bir engel olmayabileceğini düşünüyor. Çünkü şirketler, sorunun üstesinden gelmek için çeşitli yaklaşımlar deneyebilir.

“Şirketler, giderek artan bir şekilde özel verileri model eğitiminde kullanmaya çalışıyor,” diyen Villalobos, Facebook’un yakın zamanda sohbet robotlarındaki etkileşimleri YZ modellerini eğitmek için kullanacağını örnek veriyor.

İLGİNİZİ ÇEKEBİLİR: Sanatçılar Meta’nın Yeni Yapay Zekâ Politikası Nedeniyle Instagram’dan Ayrılıyor: İşte Geçtikleri Yeni Uygulama

Bir diğer seçenek ise sentetik veri üretmek. Ancak bu yöntem şu ana kadar yalnızca oyun, kodlama ve matematik alanlarında başarılı oldu. Şirketlerin başka bir yolu ise fikri mülkiyet haklarını veya özel bilgileri izinsiz kullanmak ki, bu durumda yasal sıkıntılar yaşanması muhtemel.

Gelecekte Yaşanacak Olası Sorunların Önüne Nasıl Geçilecek?

Macquarie Üniversitesi’nden Dr. Rita Matulionyte, konuyla ilgili olarak şu yorumda bulundu:

“İçerik üreticileri, yapay zekâ şirketlerinin izinsiz olarak içeriklerini kullanmasına itiraz ediyor ve bazıları Microsoft, OpenAI ve Stability AI’ye dava açtı.”

Tüm bunların ötesinde, verilerin azlığı YZ’nin karşılaştığı tek sorun değil. Uluslararası Enerji Ajansı’na göre ChatGPT destekli bir Google araması, geleneksel bir aramadan neredeyse 10 kat daha fazla elektrik tüketiyor. Bu nedenle bazı teknoloji devleri, veri merkezlerini beslemek için henüz uygulanabilir olmayan nükleer füzyon başlangıçlarına yatırım yapıyor.

Her ne kadar günümüzde yapay zekânın bilgi açlığı endişe verici bir boyuta ulaşmış olsa da, insanoğlunun sürekli yeni bilgiler üretmesi sayesinde gelecekte daha fazla veri kaynağı oluşacağı aşikar. Asıl mesele bu açlığın ne şekilde giderileceği ve bunun beraberinde getireceği olası riskler. Yapay zekâ çağında şirketlerin etik sınırları ne ölçüde zorlayacağı ve buna karşın düzenleyici kurumların atacağı adımlar, geleceğin şekillenmesinde büyük rol oynayacak.

Sizler de gelecekteki olasılıklar hakkında yorumlarınızı Kayıp Rıhtım Forum’da paylaşabilir, daha fazlası için bizleri Google News’ten takibe alabilirsiniz.

Kaynak: Live Science

Ethem Yekta Ulaş

21 yaşındayım ve Güzel Sanatlar Fakültesi'nde okuyorum. Çocukluğumdan beri bir şeyler üretmeyi seviyorum ve farklı alanlarda deneyim kazanmak istiyorum. Tutkum, öğrenme isteğim ve bu alanlarda kendi tarzımı oluşturma çabamla ilerlemeye devam ediyorum.

Yorum Yap

Exit mobile version