GPT-4

Vikipediya, azad ensiklopediya
Naviqasiyaya keç Axtarışa keç
GPT-4
Tipi böyük dil modeli
Tərtibatçı OpenAI
Proqramlaşdırma dili Python
Yayımlanma tarixi 14 mart 2023
Sayt openai.com/gpt-4

GPT-4OpenAI tərəfindən yaradılmış multimodal böyük dil modeli. GPT təməl modelləri sırasında dördüncüdür.[1] O, ilkin olaraq 14 mart 2023-cü ildə buraxıldı[1] və ödənişli çatbot məhsulu ChatGPT Plus və OpenAI-ın API-si vasitəsilə ictimaiyyətə təqdim edildi.[2] Transformator əsaslı bir model olaraq, GPT-4 növbəti tokeni proqnozlaşdırmaq üçün həm ictimai məlumatlardan, həm də "üçüncü tərəf provayderlərin lisenziyalı məlumatlarından" istifadə edərək təlim öncəsi paradiqmadan istifadə edir. Bu addımdan sonra model daha sonra insanların uyğunlaşması və qaydalara uyğunluğu üçün insanlardan və süni intellektdən gələn rəylər sayəsində dəqiq olaraq tənzimləndi.[3]:2

Müşahidəçilər, ChatGPT-nin GPT-4-dən istifadə edərək təkrarlanmasının GPT-3.5-ə əsaslanan əvvəlki iterasiyanın təkmilləşdirilməsi olduğunu, GPT-4-ün əvvəlki versiyalardakı bəzi problemləri özündə saxladığını bildirdilər.[4] GPT-4 həmçinin ChatGPT-də daxil edilən mətn əsasında şəkillər çəkə bilir.[5] OpenAI, modelin dəqiq ölçüsü kimi GPT-4 haqqında müxtəlif texniki təfərrüatları və statistik məlumatları açıqlamaqdan imtina edib.[6]

OpenAI 2018-ci ildə ilk GPT modelini (GPT-1) təqdim etdi və "General Pre-Training ilə Dil Anlayışının Təkmilləşdirilməsi" adlı məqalə dərc etdi.[7] O, transformator arxitekturasına əsaslanmış və böyük bir kitab korpusu üzərində hazırlanmışdır.[8] Növbəti il ardıcıl mətn yarada bilən daha böyük model olan GPT-2 təqdim edildi.[9] 2020-ci ildə bir neçə nümunə ilə müxtəlif tapşırıqları yerinə yetirə bilən GPT-2-dən 100 dəfə artıq parametrə malik olan GPT-3 modeli təqdim edildi.[10] GPT-3, ChatGPT çatbot məhsulunu yaratmaq üçün istifadə edilən GPT-3.5 olaraq təkmilləşdirildi.

Şayiələr, GPT-4-ün 1,76 trilyon parametrə malik olduğunu iddia edir. Bu, ilk dəfə işlədiyi sürət əsas götürülərək və Corc Hots tərəfindən hesablanmışdır.[11]

  1. 1 2 Edwards, Benj. "OpenAI's GPT-4 exhibits "human-level performance" on professional benchmarks". Ars Technica. March 14, 2023. March 14, 2023 tarixində arxivləşdirilib. İstifadə tarixi: March 15, 2023.
  2. Wiggers, Kyle. "OpenAI makes GPT-4 generally available". TechCrunch (ingilis). 2023-07-06. August 16, 2023 tarixində arxivləşdirilib. İstifadə tarixi: 2023-08-16.
  3. OpenAI. "GPT-4 Technical Report". 2023. arXiv:2303.08774 [cs.CL].
  4. Belfield, Haydn. "If your AI model is going to sell, it has to be safe". Vox. March 25, 2023. March 28, 2023 tarixində arxivləşdirilib. İstifadə tarixi: March 30, 2023.
  5. Roose, Kevin. "The New ChatGPT Can 'See' and 'Talk.' Here's What It's Like". The New York Times. 2023-09-28. October 31, 2023 tarixində arxivləşdirilib. İstifadə tarixi: 2023-10-30.
  6. Vincent, James. "OpenAI co-founder on company's past approach to openly sharing research: "We were wrong"". The Verge. March 15, 2023. March 17, 2023 tarixində arxivləşdirilib. İstifadə tarixi: March 18, 2023.
  7. Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. "Improving Language Understanding by Generative Pre-Training" (PDF). June 11, 2018. January 26, 2021 tarixində arxivləşdirilib (PDF). İstifadə tarixi: April 3, 2023.
  8. Khandelwal, Umesh. "How Large Language GPT models evolved and work". April 1, 2023. April 4, 2023 tarixində arxivləşdirilib. İstifadə tarixi: April 3, 2023.
  9. "What is GPT-4 and Why Does it Matter?". April 3, 2023. April 3, 2023 tarixində arxivləşdirilib. İstifadə tarixi: April 3, 2023.
  10. Brown, Tom B. "Language Models are Few-Shot Learners". July 20, 2020. arXiv:2005.14165v4 [cs.CL].
  11. Schreiner, Maximilian. "GPT-4 architecture, datasets, costs and more leaked". THE DECODER (ingilis). 2023-07-11. July 12, 2023 tarixində arxivləşdirilib. İstifadə tarixi: 2023-07-12.