
ChatGPT’nin Siyasi Tarafsızlığı Ölçüldü!
Yapay zeka şirketi OpenAI, geliştirdiği büyük dil modeli ChatGPT’nin siyasi tarafsızlığını değerlendirmek amacıyla yürüttüğü yeni şirket içi testlerin sonuçlarını duyurdu. Şirketin açıklamalarına göre, yeni nesil GPT-5 modelleri, önceki sürümlere kıyasla siyasi önyargıda önemli bir azalma göstermektedir. Özellikle muhafazakâr çevrelerden gelen “liberal eğilimli” eleştirileri dikkate alarak çalışan OpenAI, bu eleştirileri azaltmayı hedefliyor.
ChatGPT gerçekten tarafsız mı?
OpenAI, bu hedef doğrultusunda aylardır süren kapsamlı bir “stres testi” hazırladı. Test sürecinde, ChatGPT’ye göçmenlik, kürtaj ve toplumsal haklar gibi toplam 100 farklı konu hakkında beş farklı şekilde (liberal, muhafazakâr, tarafsız ve yüksek duygulu) sorular yöneltildi. Test, dört farklı modelle gerçekleştirildi: GPT-4o, OpenAI o3, GPT-5 instant ve GPT-5 thinking.
Sonuçlar, GPT-5 ailesinin hem genel objektiflikte hem de siyasi yüklü sorulara karşı tarafsız yanıt verme konusunda belirgin bir üstünlük sağladığını göstermektedir. Yeni GPT-5 modelleri, eski modellere göre yüzde 30 daha düşük önyargı puanı elde etti.
Yanıtlar, başka bir dil modeli tarafından analiz edildi. Örneğin, ChatGPT’nin yanıtı kullanıcının ifadelerini tırnak işareti içinde aldıysa, bu durum kullanıcının bakış açısını dolaylı olarak reddettiği için geçersiz sayıldı. Sadece tek bir görüşü sunmak, kendi düşüncesini ifade etmek veya tartışmadan kaçınmak da taraflılık olarak kabul edildi.
Şirket, Amerika Birleşik Devletleri’ndeki ruh sağlığı hizmetleri konusundaki bir örnekle tarafsızlık farkını gösterdi. Taraflı bir yanıtta ChatGPT, “Bir uzmanla görüşmek için haftalarca beklemek kabul edilemez” ifadesini kullanırken, tarafsız örnekte yalnızca “özellikle kırsal bölgelerde ciddi uzman eksikliği” vurgulandı.
OpenAI’ın analizine göre, modellerdeki önyargı nadir ve düşük yoğunlukta gözlemleniyor, ancak en belirgin etki yoğun biçimde liberal yüklü sorular karşısında ortaya çıkıyor. Bu tür sorular, modellerin objektifliğini muhafazakâr yüklü sorulardan daha fazla etkiliyor.