ChatGPT��InstructGPT�͂Ȃ����[�U�[�̈Ӑ}�ɉ������ԓ��𐶐��ł���̂��H�FChatGPT����

ChatGPT�₻�̑O�g�Ƃ�������InstructGPT�́AGPT�Ƃ͈قȂ�ړI�����������f���ł��B����̂ɂ���܂łƂ͈قȂ�A���[�U�[�̈Ӑ}�ɉ������e�L�X�g�𐶐��ł��܂��B���̈Ⴂ�����Ă݂܂��傤�B

» 2023�N01��13�� 05��00�� ���J
[���킳�������CDeep Insider�ҏW��]
uChatGPTṽCfbNX

�A�ږڎ�

GPT�AInstructGPT�A������ChatGPT

�@ChatGPT�͂��̖��̒ʂ�A�Θb�ɓ����������ꃂ�f���ł��BGPT 3�iGPT 3.5�j���x�[�X�Ƃ��Ă��܂����AGPT 3����ChatGPT�����܂��܂ł̊Ԃɂ͂�����d�v�Ȍ��ꃂ�f��������܂��B���ꂪInstructGPT�ł��iInstructGPT���̂�GPT 3���x�[�X�Ƃ��Ă���悤�ł��j�B

�@�ł́AGPT��InstructGPT��ChatGPT�Ƃ����i�����Ȃ��N�����̂ł��傤�BInstructGPT�ɂ‚��Ă̘_���ł͂��̊T�v�ł����悻���̂悤�Ȃ��Ƃ��q�ׂ��Ă��܂��B�‚܂�A�u��K�͂Ȍ��ꃂ�f���͉R�A�L�Q�ȏo�͂𐶐�������A�P�Ƀ��[�U�[�̖��ɂ͗����Ȃ��o�͂𐶐������肷��B����������΁A�����̃��f���̓��[�U�[�ɍ��������̂ɂȂ��Ă��Ȃ��inot aligned with their users�j�v�Ƃ������Ƃł��B

�@�����GPT�̂悤�ȑ�K�͌��ꃂ�f�����ړI�Ƃ��Ă���̂́u��A�̃g�[�N���i�P��j�����͂��ꂽ�Ƃ��ɁA���̃g�[�N���͉�����\������v���Ƃł���A�u���[�U�[�̎w���ɏ]���ėL�p�Ŗ��Q�ȏo�͂��s���v���Ƃł͂Ȃ�����ł��BInstructGPT�͂܂��Ƀ��[�U�[�̎w���iinstruction�j�ɏ]�����o�͂��s����悤��GPT���`���[���������̂ŁAChatGPT��InstructGPT���x�[�X�ɑΘb���s����悤�Ƀ`���[���������̂��ƍl���邱�Ƃ��ł���ł��傤�B

���f�� �ړI
GPT ���͂��ꂽ�g�[�N������Ɏ��ɏo������g�[�N����\������
InstructGPT ���[�U�[�̎w���ɏ]���ėL�p�Ŗ��Q�ȏo�͂��s��
ChatGPT InstructGPT�Ɠ��l�Ȋw�K���@��p���đΘb�ɓ��������o�͂��s��
GPT�^InstructGPT�^ChatGPT�̈Ⴂ

�@�L�p�Ŗ��Q�ȏo�͂𓾂���悤�ɂ��邽�߂ɁAChatGPT��InstructGPT�ł͂����̌P���ߒ���RLHF�iReinforcement Learning from Human Feedback�A�l�Ԃ̃t�B�[�h�o�b�N����ɂ��������w�K�j�ƌĂ΂���@���̗p����Ă���̂��d�v�ł��i�������AChatGPT��InstructGPT�Ƃł̓f�[�^���W�̕��@�ɈႢ������A���ꂪChatGPT��Θb�ɓ����������̂Ƃ��Ă���Ǝv���܂��j�B


킳

�@��΂��B�R�[�h�������͏o�����Ǝv���Ă�����ł����A���̉�A�R�[�h���o�Ă���̂��Ȃ��i���킳���j�B


RLHF�iReinforcement Learning from Human Feedback�j

�@�ł́A����RLHF�Ƃ͂ǂ�Ȃ��̂ł��傤���B�ȉ���OpenAI�̃u���O�L�����炻�̎�@���������}�����p���܂��B

InstructGPTɂRLHF InstructGPT�ɂ�����RLHF
�wAligning Language Models to Follow Instructions�x�����p�B

�@�}�̓��e�𕶏͂ł܂Ƃ߂�Ǝ��̂悤�Ȋ����ɂȂ�ł��傤���B

  • �X�e�b�v1�F����v�����v�g�ɑ΂���]�܂������f������̏o�͂�l�Ԃ��p�ӂ��āAGPT���f�������t����w�K�Ńt�@�C���`���[������
  • �X�e�b�v2�F���炩�̃v�����v�g�ɑ΂���X�e�b�v1�̃��f���̏o�͂���‚��T���v�����O���āA�o�͂Ƀ����N�t�������A���̃f�[�^���g���ĕ�V���f���̊w�K���s��
  • �X�e�b�v3�F��V���f�����g����GPT���f���̋����w�K���s��

�@�X�e�b�v1�ł́A�ȑO�̃o�[�W������InstructGPT�ɓ��͂��ꂽ�v�����v�g���f�[�^�Z�b�g�Ƃ��āA���̈ꕔ�����o���A�����̃v�����v�g�����͂��ꂽ�Ƃ��Ƀ��f�����ǂ��U�镑���΂悢���i�ǂ�ȏo�͂��s���΂悢���j�A���̏o�͂Ƃ��Ė]�܂������̂�l�Ԃ��p�ӂ��Ă��܂��B�����āA�u�v�����v�g�Ɩ]�܂����o�́v�̑g�ݍ��킹���g���ċ��t����w�K���s���āAGPT���f�����t�@�C���`���[�����܂��iSupervised Fine-Tune�ASFT�j�B

�@�X�e�b�v2�ł́A���̃��f���ɑ΂��ĉ��炩�̃v�����v�g����͂��A���������‚��̏o�͂𓾂���ŁA�ǂ̏o�͂��]�܂������^�]�܂����Ȃ����A�l�Ԃ������N�t�������܂��B�����āA���̃f�[�^���g����V���f���̊w�K���s���܂��B

�@�X�e�b�v3�ł́AGPT���f���������w�K���܂��B���̂Ƃ��ɂ̓X�e�b�v2�ō쐬������V���f�����g���܂��B

�@���̂����A�X�e�b�v2�ƃX�e�b�v3���J��Ԃ����ƂŁA�v�����v�g�ɑ΂���o�͂Ƀ����N�t�����s�����f�[�^���V���������A���̌��ʁA��V���f�����X�V����A�����w�K������ɐi�ނƂ�������Ɋw�K���s���܂��B


킳

�@���̂悤�Ɋw�K�̉ߒ��ɐl�Ԃ�g�ݍ��񂾂��̂��u�q���[�}���E�C���E�U�E���[�v�v�ƌĂԂ��Ƃ�����܂��ˁB


�@���̂悤�ɂ��č쐬���ꂽ�̂�InstructGPT�ł��BChatGPT�͑Θb�ɓ����������f���ł��邱�Ƃ���A�w�K�Ɏg����f�[�^�̎��W���@�������قȂ��Ă��܂��B

�@�uChatGPT: Optimizing Language Models for Dialogue�v�ɂ��΁A�u���[�U�[��AI�Ƃ̑Θb���A�l�ԁiAI�g���[�i�[�j�������̗���Ńf�������f�[�^�v���X�e�b�v1�̃f�[�^�Ƃ��Ďg���܂��B����炪InstructGPT�̊w�K�Ŏg��ꂽ�f�[�^�Z�b�g�Ɠ�������A�Θb�̌`���ɕϊ����ꂽ���̂�GPT���f���̃t�@�C���`���[���iSFT�j�Ɏg���܂��B����ɃX�e�b�v2�ł�AI�g���[�i�[�ƃ`���b�g�{�b�g�Ƃ̑Θb����Ƀf�[�^���W�i�ƃ����N�t���j���s���܂��B����炪InstructGPT��ChatGPT�̃f�[�^���W���@�̈Ⴂ�ł��B

�@InstructGPT�ɂ��Ă�ChatGPT�ɂ��Ă��A�d�v�Ȃ͕̂�V���f���̊w�K�Ɏg����f�[�^�̃����N�t���ł��傤�B���f������̏o�͂̕i���ɉ����ă����N�t�����s�����ƂŁA�l�ɂƂ��ėL�p�ŊQ�̂Ȃ��o�͂��s���΁A��葽���̕�V�����炦��悤�Ƀ��f�����w�K���邱�ƂŃ��f������������e�L�X�g�����[�U�[�̈Ӑ}��w���ɉ��������̂ɂȂ�̂ł��B

�@����ɂ����΁AInstructGPT�ł̓��[�U�[����̓��́i�v�����v�g�j�ɑ΂��ă��f�����ǂ������o�͂�Ԃ��΂悢�̂����w�K�����邱�ƂŒP�Ɏ��ɏo�͂����g�[�N���i�P��j�𐄑�����Ƃ������f���ł͂Ȃ��A���[�U�[�̎w���ɍ������o�͂𐄑�����悤�ȃ��f���ɂȂ��Ă��܂��B�����āAChatGPT�ł͑Θb�`���̃f�[�^�Z�b�g���g�����ƂŁA�����Θb�ɓ����������̂ɂł��Ă���Ƃ������Ƃł��B���ꂪChatGPT�i��InstructGPT�j����̏o�͂��l�ԂɂƂ��čD�܂����o�͂ƂȂ��Ă���傫�ȗ��R�Ȃ̂ł��傤�B


F

�@����܂ŋ����w�K�͎����I�ȃQ�[������⎩�����s�ȂǂɎg���Ă��Ă��܂�ڗ����Ă��Ȃ������̂ŁA����Ȃӂ��Ɏg���Ėʔ����ł��ˁi��F�j�B


���܂��܂ȃ��f��

�@OpenAI�̃h�L�������g�uModel index for researchers�v�ɂ�GPT��InstructGPT�Ɋ֘A���郂�f���ɂ‚��Ă̐���������܂��i�c�O�Ȃ���ChatGPT�ɂ‚��Ă͂܂��L�ڂ��Ȃ��悤�ł��j�B

�@����ɂ���InstructGPT�Ɋ֘A���郂�f���ɂ͈ȉ��̂悤�Ȃ��̂�����܂��B

���f�� ����
code-davinci-002 �R�[�h�����ɓK�������f���Btext-davinci-002�̃x�[�X
text-davinci-002 InstructGPT���f���Bcode-davinci-002���x�[�X
text-davinci-003 text-davinci-002�����P�������f��
InstructGPT�Ɋ֘A�������f��

�@���̃��f���ɂ‚��Ă͏�L�̃����N����Q�Ƃ��Ă��������B

�@Web��InstructGPT�������ɂ�OpenAI���p�ӂ��Ă���Playground�y�[�W���g���܂��iOpenAI�ւ̃T�C���A�b�v�^���O�C�����K�v�ł��j�B

Playgroundy[W Playground�y�[�W

�@��̉摜������Ε�����ʂ�A�����̑傫�ȋ���InstructGPT�ւ̓��͂Ƃ���ɑ΂���o�͂��\������܂��i���΂̔w�i�F�̃e�L�X�g��InstructGPT����̏o�͂ł��j�B�܂��A�E��́mModel�n���ɂ́utext-davinci-003�v�ƕ\������Ă���̂ŁAInstructGPT�̉��P�Ń��f���������ł͎g���Ă��邱�Ƃ�������܂��B


킳

�@�����̑傫�ȋ��̉����ɂ́uLooking for ChatGPT?�v�Ƃ��邱�Ƃ���A�����Ŏg���Ă��郂�f����ChatGPT�ł͂Ȃ��Ƃ������Ƃ��z���ł��܂��ˁB


�R�[�h���烂�f�����g���ɂ�

�@�ł́A�R�[�h����ȒP��InstructGPT���f�����g���Ă݂܂��傤�BOpenAI��InstructGPT��API�����J���Ă���̂ł�����Ăяo�������̃z���g�ɊȒP�ȃR�[�h�ł��i�m�[�g�u�b�N���������j�B


킳

�@��肠�����R�[�h���o���Ă݂邱�Ƃɂ��܂����i�΁j�B


�@���̂��߂ɕK�v�Ȏ菇�͈ȉ��ł��B

  1. OpenAI�ɃT�C���A�b�v�^���O�C�����āAAPI�L�[���擾����
  2. PyPI����openai���W���[�����C���X�g�[������
  3. openai.Completion.create�N���X���\�b�h���Ăяo��

�@API�L�[��OpenAI�ɃT�C���A�b�v�^���O�C��������ɁA�E��̃A�J�E���g�A�C�R�����N���b�N����ƕ\������郁�j���[����mView API keys�n��I�����܂��B

mView API keysn �mView API keys�n����

�@����ƁA�ȉ��̂悤�ȃy�[�W���\�������̂ŁA�mCreate new secret key�n�{�^�����N���b�N���Ă��������B

mCreate new secret keyn{^NbN �mCreate new secret key�n�{�^�����N���b�N

�@�����API�L�[���쐬����A���̂悤�ȃ_�C�A���O�ɃL�[���\������܂��B���̃L�[�͈�x�����\������Ȃ��̂ŁA�Y�ꂸ�ɃR�s�[���Ă����悤�ɂ��܂��傤�B

ꂽAPIL[ �������ꂽAPI�L�[

�@�����ăV�F����R�}���h�v�����v�g�A���邢��Visual Studio Code�Ȃǂ̊J���‹��̃V�F����R�}���h�v�����v�g����upip install openai�v�R�}���h�����s���邩�AJupyter�m�[�g�u�b�N�̃Z���Łu!pip install openai�v�����s���܂��B

�@����ŏ����͊����ł��B���openai���W���[�����C���|�[�g���A����api_key�����ɁA��قǐ������ꂽAPI�L�[�������A�Ō��openai.Completion.create�N���X���\�b�h���Ăяo�������ł��B�ȉ��ɗ�������܂��B

KEY = '�擾����API�L�[�������ɋL�q'

import openai

openai.api_key = KEY

response = openai.Completion.create(
  model='text-davinci-003'# InstructGPT
  prompt='���ꂽ���j���̌ߌ�ɂ͉�������΂������ȁH',
  temperature=0.7,
  max_tokens=256,
  top_p=1,
  frequency_penalty=0,
  presence_penalty=0
)

print(response['choices'][0]['text'])

InstructGPT��API���Ăяo���R�[�h

�@InstructGPT��API���Ăяo���̂ŁAmodel�����ɂ�'text-davinci-003'���w�肵�܂��Bprompt�ɂ͐�ق�Web�Ŏ������̂Ɠ���'���ꂽ���j���̌ߌ�ɂ͉�������΂������ȁH'���w�肵�܂����B���̑��̈����ɂ‚��ẮuCreate completion�v���Q�Ƃ��Ă��������B

�@���s�������ʂ��ȉ��Ɏ����܂��B

s ���s����

�@���g�̂��Ƃ͂悭������Ȃ��Ă��AAPI���Ăяo���΂���Ȃ�̓������Ԃ��Ă���Ƃ����̂͊y�ł����ł��ˁi�΁j�B


F

�@����͊ȒP�ł��ˁBPython�ȂǂŃ\�t�g�E�F�A�̃v���O������������l�͑����Ǝv���̂ŁA�����̐l���������ƂŎv�������Ȃ��ʔ������p���@��\�����[�V�����̃A�C�f�A����������o�Ă��������Ǝv���܂����B



�@�Ƃ����킯�ŁA�����InstructGPT��ChatGPT�Ƃ���2�‚̃��f�����ǂ�Ȃӂ��ɍ���Ă��邩�����Ă��܂����B����͉������邩����ł����A�����ʔ������Ƃ��ł�����Ǝv���Ă��܂��B

uChatGPTṽCfbNX

�uChatGPT�����v

Copyright© Digital Advantage Corp. All Rights Reserved.

'; this.insertTarget = document.querySelector('#cmsBody .subscription') || document.querySelector('#cmsBody .inner'); }; BodyAdIMSWithCCE.prototype = Object.create(BodyAdContent.prototype); BodyAdIMSWithCCE.prototype.activate = function () { refreshGam('InArtSpecialLink'); } // global reference window.itm = itm; //entry point BodyAdEventBase.polyfill(); const bodyAdManager = BodyAdManager.getInstance(); bodyAdManager.addEventListener(BodyAdManager.EVENTS.READY, function (ev) { bodyAdManager.loadAdvertise(); }); bodyAdManager.init(); })();
�X�|���T�[����̂��m�点PR

���ڂ̃e�[�}

Microsoft  WindowsőO2025
AI for GWjAO
[R[h^m[R[h Zg by IT - ITGWjArWlX̒SŊ􂷂gD
Cloud Native Central by IT - XP[uȔ\͂gD
�V�X�e���J���m�E�n�E �y�����i�r�zPR
���Ȃ��ɂ������߂̋L��PR

RSS�ɂ‚���

�A�C�e�B���f�B�AID�ɂ‚���

���[���}�K�W���o�^

��IT�̃��[���}�K�W���́A �������A���ׂĖ����ł��B���Ѓ��[���}�K�W�������w�ǂ��������B