Oyun Teorisi: Yapay Zekayı Nasıl Daha Akıllı Hale Getiriyor?

 


Oyun Teorisi: Yapay Zekayı Nasıl Daha Akıllı Hale Getiriyor?

MIT CSAIL araştırmacıları, süreci bir tarafın cümleler oluşturduğu ve diğer tarafın bunları değerlendirdiği bir oyun olarak ele alarak yapay zeka metinlerinin anlaşılmasını ve oluşturulmasını geliştirmek için bir "fikir birliği oyunu" geliştirdi. Denge sıralaması adı verilen bu yöntem, okuduğunu anlama, matematik problem çözme ve diyalog gibi görevlerde yapay zeka performansını önemli ölçüde artırıyor. 

MIT CSAIL araştırmacıları, yapay zekanın metin anlama ve oluşturma becerilerini geliştiren yeni bir "fikir birliği oyunu" geliştirdi. MIT'nin "fikir birliği oyunu", oyun teorisini kullanarak yapay zeka metin üretimini geliştiriyor. Bu yöntem, yani denge sıralaması, yapay zeka performansını ve güvenilirliğini artırır ancak hesaplama zorluklarıyla karşı karşıyadır. Dil modeli kod çözmeyi önemli ölçüde ilerletebilir. 

Yapay Zeka Konsensus Oyunu: Dil Modellerine Yeni Bir Yaklaşım 

Bir arkadaşınızla amacınızın yalnızca şifreli cümleler kullanarak gizli mesajları birbirinize iletmek olduğu bir oyun oynadığınızı hayal edin. Arkadaşınızın görevi cümlelerinizin ardındaki gizli mesajı tahmin etmektir. Bazen ipuçlarını doğrudan siz veriyorsunuz, bazen de arkadaşınız verdiğiniz ipuçlarına göre evet-hayır soruları sorarak mesajı tahmin etmek zorunda kalıyor. 

Buradaki zorluk, ikinizin de birbirinizi doğru anladığınızdan ve gizli mesaj üzerinde anlaştığınızdan emin olmak istemenizdir. MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL) araştırmacıları, yapay zekanın metni anlama ve üretme şeklini geliştirmeye yardımcı olmak için benzer bir "oyun" yarattı. "Uzlaşma oyunu" olarak bilinen bu oyun, yapay zeka sisteminin iki bölümünü içeriyor; bir bölüm cümleler oluşturmaya çalışıyor (ipuçları vermek gibi), diğer bölüm ise bu cümleleri anlamaya ve değerlendirmeye çalışıyor (gizli mesajı tahmin etmek gibi).

MIT araştırmacılarının “fikir birliği oyunu”, dil modelinin kodunun çözülmesine yönelik oyun-teorik bir yaklaşımdır. Denge sıralama algoritması, çeşitli görevler genelinde tahmin doğruluğunu artırmak, daha büyük modellerden daha iyi performans göstermek ve oyun teorisinin dil modeli tutarlılığını ve doğruluğunu iyileştirmedeki potansiyelini ortaya koymak için üretken ve ayrımcı sorgulamayı uyumlu hale getirir. 

Yapay Zekaya Oyun Teorisi Yaklaşımı 

Araştırmacılar, bu etkileşimi, yapay zekanın her iki parçasının da doğru mesaj üzerinde anlaşmaya varmak için belirli kurallar altında birlikte çalıştığı bir oyun olarak ele alarak, yapay zekanın sorulara doğru ve tutarlı yanıtlar verme yeteneğini önemli ölçüde geliştirebileceklerini keşfettiler. Bu yeni oyun benzeri yaklaşımı okuduğunu anlama, matematik problemlerini çözme ve konuşmaları sürdürme gibi çeşitli görevlerde test ettiler ve bunun yapay zekanın genel olarak daha iyi performans göstermesine yardımcı olduğunu buldular. Geleneksel olarak, büyük dil modelleri iki yoldan birine yanıt verir: doğrudan modelden yanıtlar üretmek (üretken sorgulama) veya modeli önceden tanımlanmış bir dizi yanıtı puanlamak için kullanmak (ayırt edici sorgulama), bu da farklı ve bazen uyumsuz sonuçlara yol açabilir. Üretken yaklaşımla “Amerika Birleşik Devletleri'nin başkanı kimdir?” "Joe Biden" gibi basit bir cevap verilebilir. Ancak, "Barack Obama" gibi ayrımcı bir sorgu, aynı cevabı değerlendirirken bu gerçeği yanlış bir şekilde tartışabilir. 

Yapay Zeka Yanıtlarını Denge Sıralaması ile Dengelemek 

Peki tutarlı, etkili tahminlere ulaşmak için karşılıklı olarak uyumsuz puanlama prosedürlerini nasıl uzlaştırabiliriz? “Dil modellerinin bir oyun gibi metni anlamasına ve oluşturmasına yardımcı olacak yeni bir yol hayal edin. Tüm süreci karmaşık bir ipucu ve sinyal oyunu olarak ele alan, bir jeneratörün doğal dili kullanarak ayrımcıya doğru mesajı göndermeye çalıştığı, eğitim gerektirmeyen, oyun teorik bir yöntem geliştirdik. MIT'nin elektrik mühendisliği ve bilgisayar bilimleri alanında doktora öğrencisi ve CSAIL üyesi Athul Jacob, "Satranç taşları yerine kelimeler ve cümleler kullanıyorlar" diyor. 

“Bu oyunda ilerlemenin yolu 'yaklaşık dengeyi' bulmaktır ve bu da 'denge sıralaması' adı verilen yeni bir kod çözme algoritmasına yol açar. Bu, oyun teorik stratejilerinin karışıma dahil edilmesinin, dil modellerini daha güvenilir ve tutarlı hale getirme konusunda bazı büyük zorlukların üstesinden nasıl gelebileceğinin oldukça heyecan verici bir göstergesi.” Okuduğunu anlama, sağduyulu akıl yürütme, matematik problem çözme ve diyalog gibi birçok görevde test edildiğinde ekibin algoritması, bu modellerin performansını sürekli olarak geliştirdi. 

ER algoritmasının LLaMA-7B modeliyle kullanılması, çok daha büyük modellerden elde edilen sonuçları bile gölgede bıraktı. Jacob, "Halihazırda rekabetçi oldukları ve insanların bir süredir üzerinde çalıştığı göz önüne alındığında, ancak 10 kat daha büyük bir modelden daha iyi performans gösterebildiğini gördüğümüz iyileştirme düzeyi hoş bir sürprizdi" diyor.

Oyun Açık 

Birinci Dünya Savaşı öncesi Avrupa'da geçen, oyuncuların ittifaklar müzakere ettiği, arkadaşlarına ihanet ettiği ve zar kullanmadan bölgeleri fethettiği - yalnızca beceriye, stratejiye ve kişilerarası manipülasyona dayanan - stratejik bir masa oyunu olan "Diplomasi" yakın zamanda ikinci kez sahneye çıktı. . Kasım 2022'de, Jacob'ın da aralarında bulunduğu bilgisayar bilimcileri, yukarıda belirtilen becerilerin aynısını ancak doğal dille gerektiren, karma motivasyonlu yedi oyunculu oyunda insan düzeyinde yetenekler elde eden bir yapay zeka aracısı olan "Cicero"yu geliştirdi. 

Bunun arkasındaki matematik Uzlaşı Oyunu'na kısmen ilham verdi. Yapay zeka ajanlarının geçmişi, OpenAI yazılımının Kasım 2022'de sohbete girmesinden çok daha eskilere dayansa da, hâlâ iyi niyetli ama patolojik arkadaşınız gibi davranabilecekleri iyice belgelenmiştir. Konsensüs oyun sistemi, modelin orijinal içgörülerine doğruluk ve sadakat sağlayan bir anlaşma olarak dengeye ulaşır. Bunu başarmak için yöntem, üretken ve ayırt edici bileşenler arasındaki etkileşimleri, gerçeği doğru bir şekilde yansıtan ve başlangıçtaki inançlarıyla uyumlu bir cevap üzerinde fikir birliğine varıncaya kadar yinelemeli olarak ayarlar. Bu yaklaşım, iki sorgulama yöntemi arasındaki boşluğu etkili bir şekilde kapatır.  

Pratik Uygulamalar ve Zorluklar 

Uygulamada, özellikle soru cevaplama görevleri için dil modeli sorgulamaya fikir birliği oyunu yaklaşımının uygulanması, önemli hesaplama zorlukları içerir. Örneğin, MMLU gibi binlerce soru ve çoktan seçmeli yanıt içeren veri kümeleri kullanıldığında, modelin mekanizmayı her sorguya uygulaması gerekir. Daha sonra, her soru ve olası cevapları için üretken ve ayırt edici bileşenler arasında bir fikir birliğine varılmalıdır. Sistem, ilkokul geçiş hakkıyla mücadele ediyordu: matematik kelime problemleri. Doğru cevabı bulma sürecini anlamanın kritik bir bileşeni olan yanlış cevaplar üretemezdi. 

Gelecekteki yönlendirmeler 

“Son birkaç yılda hem stratejik karar vermede hem de yapay zeka sistemlerinden dil oluşturmada gerçekten etkileyici ilerlemeler görüldü, ancak ikisini nasıl bir araya getireceğimizi yeni yeni anlamaya başlıyoruz. Denge sıralaması bu yönde atılan ilk adımdır, ancak bunu daha karmaşık problemlere ölçeklendirmek için yapabileceğimiz çok şey olduğunu düşünüyorum" diyor Jacob. Gelecekteki çalışmaların bir yolu, mevcut yöntemin çıktılarını entegre ederek temel modelin geliştirilmesini içerir.

 Bu özellikle umut vericidir çünkü gerçekçilik ve açık uçlu oluşturma da dahil olmak üzere çeşitli görevlerde daha gerçekçi ve tutarlı yanıtlar verebilir. Böyle bir yöntemin temel modelin performansını önemli ölçüde iyileştirme potansiyeli yüksektir; bu, ChatGPT'den ve insanların günlük olarak kullandığı benzer dil modellerinden daha güvenilir ve gerçek çıktılar elde edilmesini sağlayabilir.

Yapay Zeka Gelişmelerine 

İlişkin Uzman Görüşleri Google Araştırma Bilim Adamı Ahmad Beirami, "ChatGPT ve Gemini gibi modern dil modelleri, çeşitli görevlerin sohbet arayüzleri aracılığıyla çözülmesine yol açmış olsa da, bu tür modellerden yanıt üreten istatistiksel kod çözme süreci onlarca yıldır değişmeden kaldı" diyor. çalışmaya dahil değildir. 

"Araştırmacılarının önerisi, bir fikir birliği oyununun dengesini çözerek dil modellerinden kod çözmeye yönelik yenilikçi bir oyun teorik çerçevesidir. Araştırma makalesinde bildirilen önemli performans kazanımları umut verici olup, dil modeli kod çözmede yeni uygulamaların telaşını artırabilecek potansiyel bir paradigma değişikliğine kapı açıyor."

Next Post Previous Post
No Comment
Add Comment
comment url
6698 sayılı Kişisel Verilerin Korunması Kanunu uyarınca hazırlanmış aydınlatma metnimizi okumak ve sitemizde ilgili mevzuata uygun olarak kullanılan çerezlerle ilgili bilgi almak için lütfen Tıklayınız