Experții care au contribuit la testarea celui mai recent model de limbaj OpenAI, O1, susțin că acesta reprezintă un progres semnificativ în utilizarea chatbot-urilor în domeniul științei. Până în prezent, inteligența artificială a facilitat numeroase descoperiri.
ChatGPT model O1 depășește toate așteptările
„În domeniul meu de fizică cuantică, O1 oferă răspunsuri mult mai detaliate și coerente” comparativ cu modelul anterior al companiei, GPT-4O, afirmă Mario Krenn, directorul Artificial Scientist Lab de la Max Planck Institute for the Science of Light din Germania, conform publicației Nature.
Krenn a fost parte a „echipei roșii”, care a testat o versiune timpurie a modelului O1 pentru OpenAI. Experții au evaluat atât contribuția pe care modelul o poate aduce științei, cât și îngrijorările legate de siguranță.
De la lansarea publică a ChatGPT în 2022, modelele mari de limbaj care stau la baza acestor platforme au evoluat semnificativ. Acestea beneficiază de un volum mai mare de date de antrenament și abilități mai puternice în ceea ce privește testele standardizate.
În testele realizate de „echipa roșie”, ChatGPT model O1 a depășit toate așteptările experților în ceea ce privește utilitatea sa. OpenAI afirmă că acest model reprezintă o schimbare semnificativă în abordarea companiei. Experții susțin că noul model AI a petrecut mai mult timp în faza de învățare, ceea ce îi permite să „gândească” la răspunsuri mai mult timp. Deși răspunsurile pot fi mai lente, acestea sunt mult mai calitative, în special în domenii în care diferențierea între răspunsurile corecte și cele greșite este clară.
OpenAI susține că O1 „poate să judece sarcini complexe și să rezolve probleme mai dificile decât modelele anterioare în știință, IT sau matematică”.
În prezent, OpenAI oferă acces la O1-preview și O1-mini, o versiune mai compactă și accesibilă, creată special pentru programatori. Aceasta este disponibilă abonaților și anumitor dezvoltatori în faza de testare.
Vezi și: Grupul Alphabet va relua generarea de imagini cu oameni pe chatbotul Gemini
De asemenea, în testele experților, ChatGPT model O1 a demonstrat abilități remarcabile. Andrew White, chimist la FutureHouse, a explorat modul în care AI poate fi aplicată în biologia moleculară. Conform lui White, experții au fost dezamăgiți de anumite aspecte ale GPT-4, dar seria O1 a schimbat această percepție.
Modelul o1 e primul care a bătut experții în setul „diamant”
Modelul O1 a devenit primul model capabil să depășească experții cu titlu de doctorat la cele mai dificile întrebări, cunoscute sub numele de setul „diamant”, în cadrul testului Graduate-Level Google-Proof Q&A Benchmark (GPQA). OpenAI susține că experții au obținut un procent de aproximativ 70%, în timp ce O1 a atins un scor mediu de 78%, cu un impresionant 93% în domeniul fizicii.
OpenAI a testat, de asemenea, ChatGPT model O1 în matematică, unde a depășit așteptările. La examenul de calificare pentru Olimpiada Internațională de Matematică, O1 a obținut un scor de 83%, în contrast cu modelul anterior, GPT-4O, care a rezolvat doar 13% dintre probleme.
Kyle Kabasares, expert la Bay Area Environmental Research Institute, a utilizat O1 pentru a rescrie codurile din proiectul său de doctorat, care se ocupa de calcularea masei găurilor negre.
„Am fost pur și simplu uimit,” a declarat Kabasares. Modelul O1 ar fi generat liniile de cod necesare într-o oră, în timp ce Kabasares a lucrat la ele timp de câteva luni singur.
Sursa: useit.ro