GPT-4o
GPT-4o | |
Fejlesztő | OpenAI |
Kategória |
|
Licenc | kereskedelmi licenc |
A GPT-4o weboldala |
A GPT-4o (GPT-4 omni) egy többnyelvű, multimodális GPT (Generative Pre-trained Transformer), az OpenAI ChatGPT sorozata ötödik tagja,[1][2] a GPT-4 továbbfejlesztett változata.
Az OpenAI-nak, a mesterséges intelligencia világszinten élenjáró fejlesztőcégének új generatív továbbfejlesztett MI modellje nevének végén a 4-es után az „o” az „omni” rövidítése, ami arra utal, hogy a modell magabiztos a beszéd, a fordítás és a képalkotás területén egyaránt. A GPT-4o a bemutatását követő hetekben iteratívan, fokozatosan kerül bevezetésre a vállalat fejlesztői és fogyasztói termékeiben. Bemutatásától kezdve a GPT-4o veszi át a ChatGPT "meghajtását".[3]
Bemutató
[szerkesztés]A GPT-4o 2024. május 13-án mutatkozott be a közönségnek.[3] Az OpenAI élőben közvetített, livestreamelt bemutatója során technológiai vezetője (CTO), Mira Murati mutatta be az új modellt.
Kiderült, hogy a modell több mint 50 nyelvet támogat, ami lefedi a beszélők több mint 97 százalékát. Murati úgy illusztrálta a modell többnyelvűségét, hogy olaszul beszélt a modellhez, amit az angolra fordított, majd viszont, angolról olaszra fordított a GPT-4o, s mindezt tette természetes, vonzó női hangon. (Kérésre, "játékból" beszélt kicsit elváltoztatott gépi, "robothangon" is a bemutató során.)[4]
Jelen és jövő
[szerkesztés]Az OpenAI API-jában[5] és a Microsoft Azure OpenAI[6] szolgáltatásában a GPT-4o kétszer olyan gyors, de csak feleannyiba kerül, ugyanakkor magasabb sebességhatárokkal rendelkezik, mint a GPT-4 Turbo.[7] A továbbfejlesztett chatbot már a bemutató időpontjától térítésmentesen elérhető a ChatGPT díjmentes szintjén, valamint az OpenAI prémium ChatGPT Plus és Team csomagjai előfizetői számára, gyakorlatilag a GPT-4o minden felhasználó számára ingyenes.[8][9]
Az új modell esetében a felhasználók kérdéseket tehetnek fel a GPT-4o-val ellátott ChatGPT-nek, de válasza közben meg is szakíthatják a ChatGPT-t. A GPT-4o „valós idejű” reakciókészséget valósít meg, és még a felhasználó hangjának árnyalataira is képes reagálni, válaszul „különböző érzelmi stílusú” hangokat generálva (beleértve az éneklést is).
Az OpenAI tervei szerint modelljeit a jövőben funkcionálisan még tovább fejleszti. Míg a GPT-4o már ma is képes megnézni egy más nyelvű menü képét és lefordítani azt, a jövőben a modell lehetővé teheti, hogy a ChatGPT például „megnézzen” egy élő sportmeccset és aztán elmagyarázza a szabályokat. Bár a modellek egyre összetettebbek, ennek ellenére az a céljuk, hogy az interakció élménye valóban természetesebbé, fesztelenebbé, könnyedebben elérhetővé váljon, Az elmúlt néhány évben nagy hangsúlyt fektettek a modellek intelligenciájának javítására, de ez az első alkalom, hogy valóban hatalmas lépést tettek előre az oldottabb, kötetlenebb, felhasználóbarátabb irányba.[3]
MI csúcson
[szerkesztés]A GPT-4o a legmagasabb teljesítményt nyújtja a multimodalitási-; tehát a hang-, a többnyelvűség és a képalkotás összehasonlítási teszteken. Ezeket az új rekordokat a hangalapú beszédfelismerés, a fordítás és a vizualitás terén állította be az új modell.[10] A GPT-4o 88,7 pontos eredményt ért el az MMLU benchmarkingjában, szemben a GPT-4 86,5 pontjával.[11]
Jelenleg ez a modell a vezető modell a Kaliforniai Egyetem (Berkeley) által vezetett Large Model Systems Organization (LMSYS) Élő-pontrendszer alapú Arena Benchmarkban.[11]
Jegyzetek
[szerkesztés]- ↑ Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. május 14.)
- ↑ Coëffé, Thomas: OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale (fr-FR nyelven). BDM, 2023. március 14. (Hozzáférés: 2024. május 14.)
- ↑ a b c Wiggers, Kyle: OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (amerikai angol nyelven). TechCrunch, 2024. május 13. (Hozzáférés: 2024. május 14.)
- ↑ „Introducing GPT-4o” (hu-HU nyelven).
- ↑ Introducing GPT-4o: our fastest and most affordable flagship model - Get up and running with the OpenAI API https://platform.openai.com/docs/quickstart
- ↑ Azure OpenAI Service – Advanced Language Models | Microsoft Azure (amerikai angol nyelven). azure.microsoft.com. (Hozzáférés: 2024. május 14.)
- ↑ Wiggers, Kyle: OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art (amerikai angol nyelven). TechCrunch, 2023. március 14. (Hozzáférés: 2024. május 14.)
- ↑ Mauran, Cecily: OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users (angol nyelven). Mashable, 2024. május 13. (Hozzáférés: 2024. május 14.)
- ↑ https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
- ↑ Hello GPT-4o We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time. - OpenAI - May 13, 2024 https://openai.com/index/hello-gpt-4o/
- ↑ a b Fedus, William. "GPT-4o is our new state-of-the-art frontier model"https://twitter.com/LiamFedus/status/1790064963966370209
További információk
[szerkesztés]- Introducing GPT-4o – a 2024. május 13-i bemutató
- Az OpenAI videócsatornája a GPT-4o részletesebb bemutatásával