Yapay Zeka

50 Dolarlık Açık AI Rakibi Yapay Zeka

Stanford Üniversitesi ve Washington Üniversitesi’ndeki araştırmacılar, yalnızca 26 dakika içerisinde ve 50 dolardan daha az bir maliyetle, OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modeli eğitmeyi başardılar. s1 olarak adlandırılan bu model, 1.000 sorudan oluşan küçük bir veri seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini daha küçük modellere aktaran distilasyon (distillation) yöntemiyle geliştirildi.

Araştırmacılar, s1’in mantıksal yeteneklerini artırmak için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden faydalandılar. Fakat Google’ın hizmet şartları, Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi amacıyla kullanılmasını yasaklamakta ve bu durum olası hukuki sorunları gündeme getirmektedir.

s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edilmiştir. Başlangıçta 59.000 sorudan oluşan büyük bir veri seti ile eğitime başlansa da, yapılan testler daha küçük bir veri setinin benzer doğruluk oranları sağladığını ortaya koymuş ve böylece eğitim süresi ile maliyet önemli ölçüde düşmüştür.

Eğitim süreci, 16 adet Nvidia H100 GPU kullanılarak tamamlanmıştır. Model, doğruluğunu artırmak için test zamanı ölçeklendirmesi (test-time scaling) adı verilen gelişmiş bir teknikten yararlanmaktadır. Araştırmacılar, modele “Wait” komutunu ekleyerek yanıt üretme süresini uzattılar ve böylece modelin yanıtlarını yeniden gözden geçirip hatalarını düzeltmesine olanak sağladılar. Bu yöntem, yapay zekanın karmaşık mantık süreçlerini daha doğru bir şekilde gerçekleştirmesini mümkün kıldı.

Bu gelişme, yüksek performanslı yapay zeka modellerinin mutlaka milyarlarca dolarlık yatırımlarla ve büyük veri merkezleriyle eğitilmesi gerekmeyeceğini kanıtlıyor. OpenAI’ın o1 modeli de benzer bir mantıksal teknik kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, benzer bir yöntemle çok daha düşük maliyetle geliştirildiğini ileri sürüyor.

Fakat OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçlamış durumda ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki tutumlarını gözden geçirmelerine yol açabilir.