Büyük dil modellerinin matematiksel araştırma yapabilme yeteneklerini test etmeyi amaçlayan “First Proof” meydan okumasının sonuçları açıklandı. 11 seçkin matematikçi tarafından başlatılan testin sonuçları, Sevgililer Günü sabahında duyuruldu. Meydana 10 matematik problematikinin çözümüne odaklanan testte, hiçbir büyük dil modelinin tüm soruları çözemediği belirtildi. First Proof ekibi, yapay zekâların matematikte daha büyük sonuçlara ulaşmasını sağlayacak 10 “lemma” sunarak yarışmanın önemini vurguladı. Yapay zekânın sınırlarını ortaya koyan meydan okuma, matematik camiasında büyüyen yapay zekâ meraklılarının ilgisini çekti. Sonuçlar incelendiğinde, yapay zekânın ürettiği bazı ispatların doğru olmadığı ve insan katkısının önemi ortaya çıktı. First Proof ekibi, ikinci tur için daha sıkı kurallarla geri döneceklerini ve yapay zekânın matematik alanındaki gelişimini yakından takip edeceklerini belirtti.
Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı
11 üst düzey matematikçi, yapay zekâya bir haftada çözmesi için 10 özgün lemma verdi. OpenAI dahil birçok ekip denedi. İşte “First Proof” meydan okumasının dikkat çeken ayrıntıları.