Dünyanın En İyi Yapay Zekâ Modeli Belli Oldu

Yapay zekâ alanında faaliyet gösteren teknoloji şirketleri, her geçen gün daha güçlü modeller geliştirmeye devam ediyor. Son yapılan kapsamlı kıyaslama testleri, en iyi yapay zekâ modelinin Google Gemini 2.5 Pro olduğunu ortaya koydu.
Google’ın yeni nesil dil modeli, pek çok testte OpenAI, Anthropic ve DeepSeek gibi güçlü rakiplerini geride bırakmayı başardı. Performans farkı, özellikle belirli alanlarda oldukça dikkat çekici düzeyde.
MathArena Testinde Ezici Üstünlük
Gemini 2.5 Pro, özellikle matematik odaklı kıyaslama testlerinden biri olan MathArena’da en dikkat çeken model oldu. Bu testte:
- Gemini 2.5 Pro: %24,4 başarı oranı
- Rakip modeller (OpenAI, Anthropic, DeepSeek): %5’in altında
Bu sonuç, Gemini 2.5 Pro’nun özellikle matematiksel akıl yürütme ve problem çözme kabiliyetinde öne çıktığını gösteriyor.
Humanity’s Last Exam Testinde de Zirvede
Yapay zekâların insan seviyesini ne zaman geçtiğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro en yüksek puanı alarak liderliği korudu. Bu test, genel bilişsel beceriler ve görev başarımı açısından modellerin kapsamlı analizini içeriyor.
Kodlama Testlerinde Zirve Değişti
Gemini 2.5 Pro’nun tüm alanlarda lider olduğu söylenemez. Özellikle yazılım odaklı testlerde:
- LiveCodeBench:
- Gemini 2.5 Pro: %70,4
- OpenAI o3-mini: %74,1
- SWE-bench:
- Gemini 2.5 Pro: %63,8
- Claude 3.7 Sonnet: %70,3
Kodlama ve yazılım özelinde yapılan bu testlerde, OpenAI ve Anthropic modellerinin hâlâ önde olduğu görülüyor.
Genel Değerlendirme
Sonuçlar, Gemini 2.5 Pro’nun genel yapay zekâ kapasitesi açısından en iyi model olduğunu gösteriyor. Ancak kodlama ve yazılım geliştirme gibi uzmanlaşmış alanlarda, farklı modeller öne çıkabiliyor. Bu da günümüz yapay zekâ rekabetinin sadece “en iyiyi üretmek” değil, aynı zamanda kullanım amacına göre özelleştirilmiş modeller geliştirmekle de ilgili olduğunu gösteriyor.