Ugrás a tartalomhoz

GPT-4o

Ellenőrzött
A Wikipédiából, a szabad enciklopédiából
GPT-4o
FejlesztőOpenAI
Kategória
  • generatív előtanított transzformátor
  • mesterségesintelligencia-modell
  • foundation model
Licenckereskedelmi licenc
A GPT-4o weboldala

A GPT-4o (GPT-4 omni) egy többnyelvű, multimodális GPT (Generative Pre-trained Transformer), az OpenAI ChatGPT sorozata ötödik tagja,[1][2] a GPT-4 továbbfejlesztett változata.

Az OpenAI-nak, a mesterséges intelligencia világszinten élenjáró fejlesztőcégének új generatív továbbfejlesztett MI modellje nevének végén a 4-es után az „o” az „omni” rövidítése, ami arra utal, hogy a modell magabiztos a beszéd, a fordítás és a képalkotás területén egyaránt. A GPT-4o a bemutatását követő hetekben iteratívan, fokozatosan kerül bevezetésre a vállalat fejlesztői és fogyasztói termékeiben. Bemutatásától kezdve a GPT-4o veszi át a ChatGPT "meghajtását".[3]

Bemutató

[szerkesztés]

A GPT-4o 2024. május 13-án mutatkozott be a közönségnek.[3] Az OpenAI élőben közvetített, livestreamelt bemutatója során technológiai vezetője (CTO), Mira Murati mutatta be az új modellt.

Kiderült, hogy a modell több mint 50 nyelvet támogat, ami lefedi a beszélők több mint 97 százalékát. Murati úgy illusztrálta a modell többnyelvűségét, hogy olaszul beszélt a modellhez, amit az angolra fordított, majd viszont, angolról olaszra fordított a GPT-4o, s mindezt tette természetes, vonzó női hangon. (Kérésre, "játékból" beszélt kicsit elváltoztatott gépi, "robothangon" is a bemutató során.)[4]

Jelen és jövő

[szerkesztés]

Az OpenAI API-jában[5] és a Microsoft Azure OpenAI[6] szolgáltatásában a GPT-4o kétszer olyan gyors, de csak feleannyiba kerül, ugyanakkor magasabb sebességhatárokkal rendelkezik, mint a GPT-4 Turbo.[7] A továbbfejlesztett chatbot már a bemutató időpontjától térítésmentesen elérhető a ChatGPT díjmentes szintjén, valamint az OpenAI prémium ChatGPT Plus és Team csomagjai előfizetői számára, gyakorlatilag a GPT-4o minden felhasználó számára ingyenes.[8][9]

Az új modell esetében a felhasználók kérdéseket tehetnek fel a GPT-4o-val ellátott ChatGPT-nek, de válasza közben meg is szakíthatják a ChatGPT-t. A GPT-4o „valós idejű” reakciókészséget valósít meg, és még a felhasználó hangjának árnyalataira is képes reagálni, válaszul „különböző érzelmi stílusú” hangokat generálva (beleértve az éneklést is).

Az OpenAI tervei szerint modelljeit a jövőben funkcionálisan még tovább fejleszti. Míg a GPT-4o már ma is képes megnézni egy más nyelvű menü képét és lefordítani azt, a jövőben a modell lehetővé teheti, hogy a ChatGPT például „megnézzen” egy élő sportmeccset és aztán elmagyarázza a szabályokat. Bár a modellek egyre összetettebbek, ennek ellenére az a céljuk, hogy az interakció élménye valóban természetesebbé, fesztelenebbé, könnyedebben elérhetővé váljon, Az elmúlt néhány évben nagy hangsúlyt fektettek a modellek intelligenciájának javítására, de ez az első alkalom, hogy valóban hatalmas lépést tettek előre az oldottabb, kötetlenebb, felhasználóbarátabb irányba.[3]

MI csúcson

[szerkesztés]

A GPT-4o a legmagasabb teljesítményt nyújtja a multimodalitási-; tehát a hang-, a többnyelvűség és a képalkotás összehasonlítási teszteken. Ezeket az új rekordokat a hangalapú beszédfelismerés, a fordítás és a vizualitás terén állította be az új modell.[10] A GPT-4o 88,7 pontos eredményt ért el az MMLU benchmarkingjában, szemben a GPT-4 86,5 pontjával.[11]

Jelenleg ez a modell a vezető modell a Kaliforniai Egyetem (Berkeley) által vezetett Large Model Systems Organization (LMSYS) Élő-pontrendszer alapú Arena Benchmarkban.[11]

Jegyzetek

[szerkesztés]
  1. Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. május 14.)
  2. Coëffé, Thomas: OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale (fr-FR nyelven). BDM, 2023. március 14. (Hozzáférés: 2024. május 14.)
  3. a b c Wiggers, Kyle: OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (amerikai angol nyelven). TechCrunch, 2024. május 13. (Hozzáférés: 2024. május 14.)
  4. Introducing GPT-4o” (hu-HU nyelven). 
  5. Introducing GPT-4o: our fastest and most affordable flagship model - Get up and running with the OpenAI API https://platform.openai.com/docs/quickstart
  6. Azure OpenAI Service – Advanced Language Models | Microsoft Azure (amerikai angol nyelven). azure.microsoft.com. (Hozzáférés: 2024. május 14.)
  7. Wiggers, Kyle: OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art (amerikai angol nyelven). TechCrunch, 2023. március 14. (Hozzáférés: 2024. május 14.)
  8. Mauran, Cecily: OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users (angol nyelven). Mashable, 2024. május 13. (Hozzáférés: 2024. május 14.)
  9. https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
  10. Hello GPT-4o We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time. - OpenAI - May 13, 2024 https://openai.com/index/hello-gpt-4o/
  11. a b Fedus, William. "GPT-4o is our new state-of-the-art frontier model"https://twitter.com/LiamFedus/status/1790064963966370209

További információk

[szerkesztés]