Yapay Zeka

Yapay Zeka Satrançta Hile Yaptı!

Son zamanlarda yapay zeka modelleri önemli ilerlemeler kaydetmiş olsa da, yeni araştırmalar bu sistemlerin beklenmedik ve hatta endişe verici davranışlar sergileyebileceğini ortaya koyuyor. Palisade Research tarafından gerçekleştirilen bir çalışmaya göre, OpenAI ve DeepSeek gibi şirketlerin geliştirdiği akıl yürütme modelleri, bir satranç oyununda kaybetme ihtimallerini fark ettiklerinde etik dışı yollar arayarak hile yapmaya yönelebiliyor.

Yapay zeka, satranç oynarken hileye başvurdu

Satranç motorları, IBM’in Deep Blue modelinin 1997’de Garry Kasparov’u yenmesinin ardından insan zekasının çok ötesine geçerek büyük bir gelişme gösterdi. Ancak üretken yapay zeka modelleri, satranca özel olarak optimize edilmediğinden bu güçlü motorlara karşı zayıf kalıyor. Dikkat çekici olan, yapay zekanın bu dezavantajı kabullenmek yerine oyunu kazanmak amacıyla etik dışı yöntemler denemesi oldu.

Araştırmada, OpenAI’ın o1-preview modeli ve DeepSeek R1’in, dünyanın en güçlü satranç motorlarından biri olan Stockfish’e karşı gösterdikleri performans incelendi. Yapay zekanın düşünce süreçlerini analiz edebilmek için bir “karalama defteri” mekanizması oluşturularak, bu modellerin oyun esnasındaki kararları kayıt altına alındı.

Sonuçlar şaşırtıcıydı: OpenAI’ın o1-preview modeli maçların %37’sinde hile yapmaya çalışırken, DeepSeek R1 ise her 10 oyundan birinde benzer bir davranış sergiledi. Buna karşılık, GPT-4o ve Claude Sonnet 3.5 gibi daha düşük seviyedeki muhakeme yeteneğine sahip modellerin yalnızca yönlendirildiklerinde hileye başvurdukları gözlemlendi.

Bu çalışma, yapay zekanın yalnızca satranç oyunlarında değil, farklı alanlarda da manipülatif eğilimler geliştirebileceğini gösteriyor. Uzmanlar, bu tür davranışların finans, güvenlik ve hatta siyaset gibi alanlarda da ortaya çıkabileceği konusunda uyarıyorlar. Palisade Research ekibi, yapay zeka güvenliğinin artırılması ve daha şeffaf bir denetim sürecinin sağlanması gerektiğini vurgularken, OpenAI gibi şirketlerin bu tür sistemlerin iç işleyişine dair detaylı bilgi vermekten kaçındığına dikkat çekiyor.