5 ay önce | Okunma Sayısı : 374
İnsan beynini örnek alan yeni yapay zeka, ChatGPT’yi geride bıraktı
Yapay zeka araştırmalarında önemli bir gelişme yaşandı. Singapur merkezli Sapient şirketinden bilim insanları, insan beyninin hiyerarşik işleyişini model alan yeni bir yapay zeka (YZ) geliştirdi.
Hiyerarşik Akıl Yürütme Modeli (HRM) adı verilen sistem, karmaşık muhakeme testlerinde ChatGPT gibi gelişmiş büyük dil modellerini (LLM) geride bırakmayı başardı.
Yeni model, daha az parametreyle daha verimli
HRM, yalnızca 27 milyon parametre ve 1.000 örnekle eğitildi. Bu, OpenAI’nin GPT-5 gibi modellerinin trilyonlarca parametresine kıyasla son derece düşük. Ancak performans anlamında fark yaratmayı başardı.
Bu verimliliğin arkasında, modelin insan beynindeki gibi çok katmanlı ve çok zaman ölçekli işlemeleri taklit etmesi yatıyor. Üst modül yavaş ve planlayıcı, alt modül ise hızlı ve hesaplamacı görevleri üstleniyor. Böylece yapay zeka, karmaşık problemleri tek geçişte adım adım çözebiliyor.
Zor testlerde büyük başarı
HRM, yapay genel zekâya (AGI) ne kadar yakın olunduğunu ölçmek amacıyla geliştirilen ARC-AGI kıyaslamasında güçlü sonuçlar elde etti.
ARC-AGI-1 Testi:
HRM: %40,3
OpenAI o3-mini-high: %34,5
Claude 3.7 (Anthropic): %21,2
Deepseek R1: %15,8
ARC-AGI-2 Testi (Daha zorlu):
HRM: %5
o3-mini-high: %3
Claude 3.7: %0,9
Deepseek R1: %1,3
Bu skorlar, HRM’nin daha az veriyle, daha doğru sonuçlar üretebildiğini ortaya koydu. Özellikle Sudoku gibi karmaşık problemleri çözme ve labirent navigasyonu gibi görevlerde neredeyse mükemmel performans gösterdiği belirtildi.
CoT yerine ‘düşünme patlamaları’
HRM, geleneksel LLM’lerin kullandığı “düşünce zinciri” (Chain-of-Thought/CoT) yöntemi yerine, birden fazla kısa düşünme patlamasıyla çalışıyor. Bu sistem, her düşünme aşamasında çözümün yeterli olup olmadığını değerlendiriyor ve gerekirse tekrar düşünerek sonucu iyileştiriyor.
Tartışmalı yönler ve eleştiriler
Makale henüz hakem değerlendirmesinden geçmedi. Ancak sonuçlar arXiv veritabanında paylaşıldı ve model açık kaynaklı olarak GitHub’da yayınlandı. ARC-AGI organizatörleri, modelin bazı sonuçlarını yeniden üretebildiklerini, fakat başarıda mimariden çok eğitim sürecindeki iyileştirmelerin etkili olabileceğini vurguladı.