Yapay Zeka

Yapay Zeka Matematik Alanında Zirveye Ulaştı

Google DeepMind ve OpenAI tarafından geliştirilen yapay zeka sistemleri, bu yıl Uluslararası Matematik Olimpiyatları’nda (IMO) olağanüstü bir başarı elde etti. Her iki kuruluşun farklı yapay zeka modelleri, yarışmadaki altı sorudan beşini doğru yanıtlayarak 42 üzerinden 35 puan almayı başardı ve bu sayede altın madalya seviyesine ulaştı.

Yapay Zeka, Matematikte Altın Madalya Kazanabilir

IMO, 1959 yılından bu yana düzenlenen, cebir, geometri, kombinatorik gibi çeşitli alanlarda öğrencileri dört buçuk saat süren zorlu matematik problemleriyle sınayan, dünyanın en prestijli akademik yarışmalarından biridir. Bu yıl, yapay zeka sistemlerinin bu denli yüksek bir başarı göstermesi, teknolojilerin insan seviyesini geçme aşamasına geldiğini göstermektedir.

Geçen yıl Google DeepMind, Gemini modeliyle yarışmaya katılmış, ancak gümüş madalya seviyesinde kalmıştı. Bu yıl ise Gemini modelinin özel bir versiyonu olan Gemini Deep Think kullanıldı. Yeni sistem, klasik düz hat üzerinden ilerleyen akıl yürütme yaklaşımının yerine, paralel düşünme yöntemine dayanan bir mimariyle çalışmaktadır.

Model, her problem için birden fazla çözüm yolu oluşturmakta ve bu yolları eş zamanlı olarak test ederek en tutarlı sonuca ulaşana kadar hipotezleri çapraz kontrol etmektedir. Spekülatif akıl yürütme modülleri sayesinde model, yalnızca çözüme ulaşmakla kalmamakta, aynı zamanda matematiksel ispatların doğruluğunu artırmak için alternatif kanıt yolları geliştirmektedir.

Ayrıca bu model, doğal dildeki problem tanımlarını doğrudan sembolik mantık yapılarına dönüştürebilmektedir. Önceki nesil sistemlerde olduğu gibi problemi bir programlama diline çevirme adımına gerek kalmadan, metinsel açıklama üzerinden adım adım geçerli bir ispat üretebilmektedir.

DeepMind ekibi, bu yapının uçtan uca bir çözüm sunduğunu ve herhangi bir dış müdahale gerektirmediğini vurguluyor. Yarışma jürisi ise Gemini’in sunduğu çözüm ve ispatların “insan tarafından yazılmış gibi göründüğü” şeklinde bir yorumda bulundu.

OpenAI tarafında ise yarışmaya henüz kamuoyuna açıklanmamış bir deneysel model ile katılım sağlandı. Bu model de çok aşamalı akıl yürütme sürecine benzer bir yaklaşım uygulamakta. Her sorunun çözümünde semantik çözüm yolları haritalanıyor ve ardından bu yollar mantıksal tutarlılıkla taranarak en sağlam sonuç elde ediliyor.

Modelin öne çıkan özelliklerinden biri, sadece doğru çözüme ulaşması değil, ayrıca oluşturduğu çözüm yollarını doğal dilde ispatlama kapasitesine sahip olmasıdır. Gelişmiş kontrol modülleri sayesinde model, her çözüm adımını içsel olarak doğrulama yeteneğine sahiptir.

Her iki sistem de mevcut haliyle doğrudan son kullanıcıya sunulmayacak. OpenAI CEO’su Sam Altman, bu düzeydeki muhakeme yeteneğinin şimdilik yalnızca araştırma amacıyla kullanılacağını belirtmektedir. GPT serisi gibi halka açık sistemlerin bu seviyede matematiksel performansa ulaşmasının yakın vadede mümkün olmadığını ifade etmektedir.