O Poslednjem ispitu čovečanstva (HLE) smo pisali OVDE. Radi se o najtežim pitanjima koje ljudi mogu postaviti a da znaju odgovore na ta pitanja. Test je namerno napravljen tako da čak i stručnjaci u datim oblastima teško mogu da odgovore na pitanja, a kamoli prosečan poznavalac date oblasti. Cilj nije samo testiranje znanja, već i sposobnosti rezonovanja na ekspertskom nivou. Zanimljivo je da najnapredniji AI modeli trenutno postižu tačnost do 20% na ovom testu, što pokazuje koliko su daleko od ljudskog nivoa ekspertize u rešavanju ovako složenih problema. Po rečima Elona Muska, novoobljavljeni Grok 4 može da dosegne do 40%.
Slika 1: Zastupljenost pitanja po oblastima
Primer pitanja iz matematike:
Iako specifično pitanje nije navedeno u izvorima, dato je da pitanja iz matematike često zahtevaju složene analitičke veštine i ne mogu se lako rešiti pretragom na internetu. Na primer, pitanje može uključivati napredne koncepte iz teorije brojeva, topologije ili višedimenzionalnog računa, sa naglaskom na dokazivanje ili izvođenje rešenja. U nastavku teksta je dat jedan primer koji prikazuje moguće pitanje.
Primer pitanja iz fizike:
Pitanja iz fizike mogu uključivati složene probleme iz kvantne mehanike, termodinamike ili astrofizike. Na primer, hipotetičko pitanje može biti: „Izračunajte promenu entropije sistema u specifičnom kvantnome stanju pod datim uslovima“, zahtevajući precizne proračune i razumevanje teorijskih koncepata.
Primer pitanja iz biologije/medicine:
„Kolibri iz reda Apodiformes jedinstveno imaju bilateralno uparenu ovalnu kost, sesamoidnu kost ugrađenu u kaudolateralni deo proširene, krucijatne aponeuroze umetanja m. depressor caudae. Koliko uparenih tetiva podržava ova sesamoidna kost?“
Ovo pitanje zahteva specifično znanje iz anatomije ptica i sposobnost razumevanja složenih bioloških struktura.
Primer pitanja iz oblasti filozofije (humanističke nauke):
„Kako se zove filozofski princip koji tvrdi da...“
(Napomena: Ovo je delimičan primer citiran na platformi X, ali bez potpunog konteksta. Pretpostavlja se da pitanje zahteva duboko razumevanje filozofskih koncepata, verovatno na nivou stručnjaka.)
Primer pitanja iz oblasti hemije:
"Prikazana reakcija je termalna periciklična kaskada koja pretvara početni hepten u metil estar endiandrične kiseline B. Kaskada uključuje tri koraka: dve elektrociklizacije praćene cikloadicijom. Koje vrste elektrociklizacija su uključene u 1. i 2. korak, i koja vrsta cikloadicije je uključena u 3. korak?"
Primer pitanja iz drevnog hebrejskg:
"Dajem standardizovani biblijski hebrejski izvorni tekst iz Biblia Hebraica Stuttgartensia (Psalam 104:7). Vaš zadatak je da razlikujete zatvorene i otvorene slogove. Molimo vas da identifikujete i navedete sve zatvorene slogove (koji se završavaju na suglasnički zvuk) na osnovu najnovijih istraživanja o tiberijskoj tradiciji izgovora biblijskog hebrejskog od strane učenjaka kao što su Geoffrey Khan, Aaron D. Hornkohl, Kim Phillips i Benjamin Suchard."
Još jedan primer iz lingvistike:
Na slici je predstavljen rimski natpis, pronađenog na nadgrobnom spomeniku. Dati prevod.
Sledeća dva pitanja nisu iz skupa od HLE pitanja, ali tačno odražavaju stil i težinu pitanja sa HLE:
Matematika:
Fizika:
Ko želi dubli uvid u HLE pitanja i dalji razvoj AI modela, predlažemo Hugging Face platformu (https://huggingface.co/) mada nije izvesno da su sva pitanja javno dostupna.
Dati primeri pokazuju da pitanja zahtevaju duboko stručno znanje i sposobnost rezonovanja, a ne samo pronalaženje informacija. Čak 14% pitanja zahteva istovremeno razumevanje teksta i slika.
Kada AI bude znao odgovor na svako pitanje koje čovečanstvo može da postavi a da svako pitanje ima smislen odgovor, čovek će ostati bez pitanja. Nova pitanja će morati da postavlja sam AI i sam će tražiti odgovore, a sama stvarnost će govoriti da li su odgovori tačni. U vidu nove fizike, novih tehnologija, novih biznisa...