OpenAI o1 modell

Bíró Gábor 2024. szeptember 13.
4 perc olvasási idő

Az OpenAI legújabb mesterséges intelligencia modellje, az o1, amely korábban „Strawberry” kódnéven futott, mostantól elérhető. Az o1 modellt kifejezetten a mesterséges intelligencia érvelési képességeinek fejlesztésére tervezték. Több forrás is arról számolt be, hogy ez az új modellcsalád célja a tudomány, a programozás és a matematika terén felmerülő összetett problémák megoldása, azáltal, hogy több időt tölt a „gondolkodással” a válaszadás előtt.

OpenAI o1 modell
Forrás:

Fejlett érvelés és teljesítmény

Az o1 modell figyelemreméltó képességeket mutatott a komplex problémamegoldás terén, különösen a STEM (tudomány, technológia, mérnöki és matematika) területeken. A tesztek során az o1 a programozási versenyeken (Codeforces) a 89. percentilisbe került, és az USA Matematikai Olimpia selejtezőjében (AIME) a legjobb 500 tanuló között végzett. Tudományos területeken, mint a fizika, biológia és kémia, meghaladta a PhD-szintű emberi pontosságot egy referenciaadatbázis (GPQA) alapján. Fejlett érvelési képessége lehetővé teszi az o1 számára, hogy összetett kérdésekkel foglalkozzon, kifinomult algoritmusokat hozzon létre, és kiválóan teljesítsen összehasonlító elemzési feladatokban, mint például szerződések vagy jogi dokumentumok vizsgálata.

Teljesítmény összehasonlítások

Az o1 modell kiemelkedő teljesítményt mutatott különböző referenciaadatbázisokon, ami fejlett érvelési képességeinek bizonyítéka. Az alábbi táblázat összefoglalja az o1 modell kulcsfontosságú eredményeit:

Referencia Teljesítmény
Codeforces (versenyprogramozás) 89. percentilis
AIME (Matematikai Olimpia selejtező) Top 500 tanuló az USA-ban
GPQA (fizika, biológia, kémia) Meghaladja a PhD-szintű pontosságot
Nemzetközi Informatikai Olimpia (IOI) 49. percentilis globálisan
Codeforces Elo besorolás 1807 (93. percentilis)
MMLU alkategóriák 57-ből 54-ben túlteljesít korábbi modelleket

Az o1 modell teljesítménye különösen figyelemreméltó a STEM területeken, bizonyítva, hogy képes összetett problémák megoldására és nehéz feladatok logikus végigvitelére. Eredményei egy új szintre emelik a mesterséges intelligencia érvelési képességeit, jelentős előrelépést jelentve a tudomány, matematika és programozás alkalmazásai terén.

o1 modell variánsok

Az o1 modell két változatban jelent meg: o1-preview és o1-mini. Az o1-mini kisebb, gyorsabb és költséghatékonyabb, kifejezetten kódolási feladatokra tervezve. Az o1-mini 80%-kal olcsóbb, mint az o1-preview, miközben a kódolási teszteken hasonlóan versenyképes teljesítményt nyújt. Mindkét modell elérhető a ChatGPT-ben és az OpenAI API-ján keresztül.

Korlátok és kihívások

Az o1 modell fejlett képességei ellenére számos kihívással néz szembe. Használata lényegesen drágább, mivel az input költségek háromszor, az output költségek pedig négyszer magasabbak, mint a GPT-4o esetében az API-n keresztül. Az o1 modell néha lassabb lehet a kérdések feldolgozásában, különösen komplex problémák esetén, amelyek több mint tíz másodpercet is igénybe vehetnek. További korlát, hogy az o1 jelenleg nem támogat olyan funkciókat, mint a webes böngészés és fájlok elemzése, amelyek elérhetők más AI modellekben.

Elérhetőség és jövőbeni tervek

Az o1 modell jelenleg elérhető a ChatGPT Plus és Team felhasználók számára, korlátozott heti üzenetküldési mennyiséggel: o1-preview esetében 30, o1-mini esetében 50 üzenet. Az o1-mini modell várhatóan hamarosan elérhető lesz minden ingyenes ChatGPT felhasználó számára is, bár konkrét megjelenési dátum még nem ismert. Az OpenAI tervei között szerepel, hogy továbbfejleszti a modell képességeit, megszünteti a korlátokat, és további funkciókat integrál, mint például a böngészés és fájlok feltöltése, hogy növelje a modell hasznosságát különböző alkalmazásokban.

Bíró Gábor 2024. szeptember 13.
© 2025 Birow.com