Veštačka inteligencija, mašinsko učenje, neuronska mreža, GPT...

Detalji: Kategorija: Tehnologija; Datum kreiranja: četvrtak, 20 april 2023 14:04; Autor Dragan Tanaskoski

Kakva je veza veštačke inteligencije (AI), mašinskog učenja (ML) i veštačke neuronske mreže. U čemu je njihova razlika, da li se dopunjuju i gde je u tome ChatGPT?

Veštačka inteligencija je grana računarstva koja se bavi razvojem računarskih sistema koji su sposobni da izvršavaju zadatke koji zahtevaju ljudsku inteligenciju. Ovi sistemi koriste algoritme i modele koji se obučavaju na velikim količinama podataka kako bi mogli da izvode složene zadatke.

Veštačka inteligencija se deli na tri osnovne kategorije:

Usko specijalizovana veštačka inteligencija (eng. Narrow AI) – ova kategorija obuhvata sisteme koji su dizajnirani da obavljaju samo jedan ili nekoliko sličnih zadataka. Primeri ovih sistema su prepoznavanje lica, automatsko prevođenje, upravljanje vozilima i drugo.

Opšta veštačka inteligencija (eng. General AI) – ova kategorija obuhvata sisteme koji su sposobni da izvršavaju širok spektar zadataka i da se prilagođavaju novim situacijama i okruženjima na način sličan čoveku. GPT možemo smestiti u ovu kategoriju.

Superinteligencija (eng. Superintelligence) – ova kategorija obuhvata sisteme koji su znatno inteligentniji od prosečnog čoveka i koji bi mogli da izvršavaju zadatke koji su za ljudski um nepojmljivi.

Mašinsko učenje

Mašinsko učenje (eng. Machine Learning) je grana veštačke inteligencije koja se bavi razvojem algoritama i modela koji računarskim sistemima omogućavaju da uče iz podataka i poboljšavaju svoje performanse u rešavanju određenog zadatka bez eksplicitnog programiranja.

Umesto da se računarski sistemi programiraju da izvršavaju specifične zadatke, mašinsko učenje im omogućava da "uče" iz podataka kako da izvode zaključke, klasifikuju objekte, predviđaju buduće događaje, identifikuju obrasce i slično.

AIDT20 1

Veštačka inteligencija i njena grana, Mašinsko učenje. Mašinsko učenje koristi Veštačku neuronsku mrežu u kojoj su kvalifikovane reči i fraze. Kvalifikovane su težinskim faktorima (parametara) dodeljenih u procesu obuke. Sistemu je na raspolaganju ogroman skup kvalifikovanih, ocenjenih reči i fraza, iz kojeg može da bira reči i fraze prilikom formiranja odgovora.

Mašinsko učenje koristi različite tehnike učenja, uključujući nadgledano učenje (eng. Supervised learning), nenadgledano učenje (eng. Unupervised learning), polunadgledano učenje i pojačano učenje (eng. Reinfoced learning). Ove tehnike se primenjuju u različitim oblastima kao što su prepoznavanje slika i govora, obrada govornih jezika, upravljanje resursima i mnogi drugi. GPT je obučen i u nadgledanom, od ljudi, i nenadgledanom procesu učenja.

Rezultat mašinskog učenja je sposobnost računarskog sistema da predvidi ili donese odluku na osnovu podataka. To se postiže vrlo sofisticiranom statističkom analizom podataka. Predviđanje se ostvaruje na osnovu podataka kojima se raspolaže. Bolje previđanje se postiže podacima, a ne programiranjem. Sistem se poboljšava učenjem a ne programiranjem.

Veštačka neuronska mreža i duboko učenje

Duboko učenje (eng. Deep Learning) je podskup mašinskog učenja koji koristi neuronsku mrežu sa velikim brojem skrivenih slojeva. Zato se zove duboka. ChatGPT ima 96 slojeva[1]. Neuronska mreže se sastoji od čvorova - neurona i statističkih veza između njih što je model kako naš mozak funkcioniše.

Duboko učenje se zasniva na algoritmima koji su u stanju da automatski uče karakteristike podataka bez prethodno definisanih pravila. Ovo se postiže iterativnim procesom obučavanja neuronske mreže na velikom broju podataka. Kako mreža uči, ona postepeno poboljšava svoje performanse u izvršavanju zadatka. Sa razvojem novih algoritama i tehnologija, očekuje se da će duboko učenje imati još širu primenu u budućnosti.

Parametri neuronske mreže ChatGPT-a

Neuronska mreža ChatGPT-a sastoji od 175 milijardi parametara. U pitanju je velika neuronska mreža sa složenom arhitekturom koja je obučena na ogromnoj količini tekstualnih podataka kako bi mogla da generiše kvalitetne odgovore. U svojoj obuci, ChatGPT je koristio kombinaciju nadgledanog i nenadgledanog učenja kako bi naučio o odnosima među rečima i frazama u govornim jezicima, kao i o raznim jezičkim strukturama, kontekstu i stilovima izražavanja.

Parametar neuronske mreže je vrednost koja se koristi za definisanje ponašanja mreže. Neuronska mreža se sastoji od mnogo malih računskih jedinica, koje se nazivaju neuroni. Svaki neuron u mreži prima ulazne signale, izvodi neku matematičku operaciju na njima, a zatim izbacuje izlazni signal. Ulazni signali se kombinuju sa težinama (engl. weights) koji su parametri mreže. Pored toga, svaki neuron ima i pristrasnost (engl. bias), koja je još jedan parametar koji se koristi za podešavanje izlaza neurona. Neuron nije parametar. Jedna neuron radi sa više parametara.

Tokom obuke neuronske mreže, težine i pristrasnosti se podešavaju kako bi se minimizovala greška izlaza mreže. Ovaj proces se obično naziva optimizacija. Optimizacija se obavlja različitim algoritmima, kao što su gradijentni spust (engl. gradient descent), Adam i RMSProp.

Važno je naglasiti da parametri u neuronskoj mreži igraju ključnu ulogu u tome kako se mreža ponaša i kako obrađuje ulazne podatke. Odabir i podešavanje parametara ima veliki uticaj na performanse neuronske mreže u različitim zadacima.

Analogija za parametre neuronske mreže mogla bi biti postavka instrumenata u orkestru. U orkestru, svaki instrument ima svoju ulogu i postavljen je na određen način kako bi se postigao željeni zvuk. Slično tome, u neuronskoj mreži, parametri su postavljeni tako da određuju način na koji se obrađuju podaci i generišu izlazi.

Kao što svaki instrument u orkestru doprinosi svojim jedinstvenim zvukom i ulogom u stvaranju celokupnog zvuka, tako i svaki parametar u neuronskoj mreži doprinosi svojim jedinstvenim značajkama i ulogom u stvaranju konačnog izlaza mreže. Parametri u neuronskoj mreži uključuju težine (engl. weights) i pristrasnosti (engl. biases), koji su podešeni tokom obuke mreže kako bi se minimizovala greška u izlazu i poboljšala performansa mreže.

Kao što se može menjati postavka instrumenata u orkestru kako bi se postigao drugačiji zvuk ili raspoloženje, tako se i parametri u neuronskoj mreži mogu podešavati kako bi se postigao drugačiji izlaz ili poboljšala performansa u određenom zadatku.

Preuzeto odavde: File:8th symphony of Mahler, Kölner Philharmonie, 27-6-2009.JPG - Wikimedia Commons

Kao što simfonijski orkestar može da odsvira svaku naučenu melodiju, bilo klasične, moderne, filmske muzike ili muzike za kompjuterske igre, džez... tako i parametri AI-a se mogu obučiti da AI daje smisleno ponašnje, odnosno smislene odgovore.

[1] ChatGPT se sastoji od 96 slojeva transformatorske neuronske mreže. Ova mreža koristi arhitekturu poznatu kao "Transformer", koja je razvijena za obradu sekvenci podataka, kao što su rečenice u prirodnom jeziku. Svaki sloj u ovoj mreži sadrži niz transformacija koje omogućavaju mreži da nauči ono što je bitno iz nizova podataka i da generiše složene izlaze na osnovu toga. Transformerska arhitektura koristi mehanizam pažnje (eng. attention) kako bi se omogućila mreži da se fokusira na određene delove niza koje su važne za zadati zadatak. Ovo omogućava mreži da uči šta je značajno iz podataka na mnogo efikasniji način nego što je to moguće kod tradicionalnih neuronskih mreža koje koriste jednosmerne ili rekurentne slojeve.

Izvor: Mašinsko učenje

Author: Dragan Tanaskoski

Zadnji tekstovi: