Pleyeri seçin:

“Bəşəriyyətin son imtahanı”nın nəticələri açıqlandı

01 aprel 2026 18 baxış

Tədqiqatçılar süni intellektin "Bəşəriyyətin son imtahanı" testində nəticələrinin əhəmiyyətli dərəcədə artdığını qeydə alıblar.

Bu barədə "ScienceDaily" saytı xəbər verir.

"Bəşəriyyətin son imtahanı" testi "Scale AI" və "Center for AI Safety" qeyri-kommersiya təşkilatlarının mütəxəssisləri tərəfindən hazırlanıb. Testin əsasında 50 ölkədən alimlərin tərtib etdiyi 70 min sual dayanır. Bu suallar arasından 2 500 tapşırıq seçilib. Hər bir sual doktorantura səviyyəsinə uyğun bilik tələb edir. Format qısa və dəqiq cavabları nəzərdə tutur və bu cavabları açıq mənbələrdən tapmaq çətindir.

2024-cü ildə modellər aşağı nəticələr göstərirdi. "ChatGPT" təxminən 3% nəticə əldə etmişdi, "Gemini" və "Claude" isə bir qədər yüksək göstəricilərə malik idi. Həmin dövrdə test dil modellərinin imkanları ilə elmi mütəxəssislərin səviyyəsi arasında ciddi fərqi ortaya qoymuşdu.

Hazırda vəziyyət dəyişib. Tərtibatçıların məlumatına görə, "Gemini" 45,9%, "Claude" isə 34,2% nəticə göstərib. "Scale AI" nümayəndəsi Kelvin Çjan bildirib ki, modellər yaxın aylarda və ya bir il ərzində 100% nəticəyə çata bilər.

Bununla belə, tərtibatçılar hesab edirlər ki, maksimum nəticə əldə olunsa belə, süni intellekt insanı tam əvəz etməyəcək. Söhbət qeyri-standart yanaşma tələb edən tapşırıqlardan, eləcə də interpretasiya və yaradıcı düşüncənin vacib olduğu dar ixtisaslı elmi sahələrdən gedir.

Bu funksiya uşaqlar və yeniyetmələrə mənfi təsir göstərə bilər

Bu funksiya uşaqlar və yeniyetmələrə mənfi təsir göstərə bilər

Texnologiya
28 mart 2026 18 baxış
İstifadəçilər arasında süni intellektlə bağlı sorğu

İstifadəçilər arasında süni intellektlə bağlı sorğu

Texnologiya
24 mart 2026 18 baxış
Smartfonlar üçün zərbədən və sudan daha təhlükəli amil

Smartfonlar üçün zərbədən və sudan daha təhlükəli amil

Texnologiya
23 mart 2026 18 baxış
Süni intellekt inteqrasiyalı mobil qurğu səs köməkçisi ilə sinxron işləyəcək

Süni intellekt inteqrasiyalı mobil qurğu səs köməkçisi ilə sinxron işləyəcək

Texnologiya
22 mart 2026 18 baxış
Qrup yazışmalarına üstünlük verənlər mütləq bilsin!

Qrup yazışmalarına üstünlük verənlər mütləq bilsin!

Texnologiya
21 mart 2026 18 baxış
“Copilot Health” adlı yeni xidmət növü təqdim edildi

“Copilot Health” adlı yeni xidmət növü təqdim edildi

Texnologiya
16 mart 2026 18 baxış
2025-ci ildə istehlakçı müraciətlərinin 30 faizi rəqəmsal sahə ilə bağlı olub

2025-ci ildə istehlakçı müraciətlərinin 30 faizi rəqəmsal sahə ilə bağlı olub

Texnologiya
12 mart 2026 18 baxış
1,5 milyondan çox məlumat sızıntısı faktı aşkarlanıb

1,5 milyondan çox məlumat sızıntısı faktı aşkarlanıb

Texnologiya
12 mart 2026 18 baxış
Qurğu orbitə 250 tona qədər yük qaldırmaq qabiliyyətinə malikdir

Qurğu orbitə 250 tona qədər yük qaldırmaq qabiliyyətinə malikdir

Texnologiya
08 mart 2026 18 baxış
Süni intellekt insan kimi düşünəcək?

Süni intellekt insan kimi düşünəcək?

Texnologiya
08 mart 2026 18 baxış
Seçilmişlər
icon