ChatGPT�₻�̑O�g�Ƃ�������InstructGPT�́AGPT�Ƃ͈قȂ�ړI�����������f���ł��B����̂ɂ���܂łƂ͈قȂ�A���[�U�[�̈Ӑ}�ɉ������e�L�X�g���ł��܂��B���̈Ⴂ�����Ă݂܂��傤�B
�@ChatGPT�͂��̖��̒ʂ�A�Θb�ɓ����������ꃂ�f���ł��BGPT 3�iGPT 3.5�j���x�[�X�Ƃ��Ă��܂����AGPT 3����ChatGPT�����܂��܂ł̊Ԃɂ͂�����d�v�Ȍ��ꃂ�f��������܂��B���ꂪInstructGPT�ł��iInstructGPT���̂�GPT 3���x�[�X�Ƃ��Ă���悤�ł��j�B
�@�ł́AGPT��InstructGPT��ChatGPT�Ƃ����i�����Ȃ��N�����̂ł��傤�BInstructGPT�ɂ��Ă̘_���ł͂��̊T�v�ł����悻���̂悤�Ȃ��Ƃ��q�ׂ��Ă��܂��B�܂�A�u��K�͂Ȍ��ꃂ�f���͉R�A�L�Q�ȏo�͂�������A�P�Ƀ��[�U�[�̖��ɂ͗����Ȃ��o�͂������肷��B����������A�����̃��f���̓��[�U�[�ɍ��������̂ɂȂ��Ă��Ȃ��inot aligned with their users�j�v�Ƃ������Ƃł��B
�@�����GPT�̂悤�ȑ�K�͌��ꃂ�f�����ړI�Ƃ��Ă���̂́u��A�̃g�[�N���i�P��j�����͂��ꂽ�Ƃ��ɁA���̃g�[�N���͉�����\������v���Ƃł���A�u���[�U�[�̎w���ɏ]���ėL�p�Ŗ��Q�ȏo�͂��s���v���Ƃł͂Ȃ�����ł��BInstructGPT�͂܂��Ƀ��[�U�[�̎w���iinstruction�j�ɏ]�����o�͂��s����悤��GPT���`���[���������̂ŁAChatGPT��InstructGPT���x�[�X�ɑΘb���s����悤�Ƀ`���[���������̂��ƍl���邱�Ƃ��ł���ł��傤�B
���f�� | �ړI |
---|---|
GPT | ���͂��ꂽ�g�[�N������Ɏ��ɏo������g�[�N����\������ |
InstructGPT | ���[�U�[�̎w���ɏ]���ėL�p�Ŗ��Q�ȏo�͂��s�� |
ChatGPT | InstructGPT�Ɠ��l�Ȋw�K���@��p���đΘb�ɓ��������o�͂��s�� |
GPT�^InstructGPT�^ChatGPT�̈Ⴂ |
�@�L�p�Ŗ��Q�ȏo�͂���悤�ɂ��邽�߂ɁAChatGPT��InstructGPT�ł͂����̌P���ߒ���RLHF�iReinforcement Learning from Human Feedback�A�l�Ԃ̃t�B�[�h�o�b�N����ɂ��������w�K�j�ƌĂ���@���̗p����Ă���̂��d�v�ł��i�������AChatGPT��InstructGPT�Ƃł̓f�[�^���W�̕��@�ɈႢ������A���ꂪChatGPT��Θb�ɓ����������̂Ƃ��Ă���Ǝv���܂��j�B
�@����B�R�[�h�������͏o�����Ǝv���Ă�����ł����A���̉�A�R�[�h���o�Ă���̂��Ȃ��i���킳���j�B
�@�ł́A����RLHF�Ƃ͂ǂ�Ȃ��̂ł��傤���B�ȉ���OpenAI�̃u���O�L�����炻�̎�@���������}�����p���܂��B
�@�}�̓��e�͂ł܂Ƃ߂�Ǝ��̂悤�Ȋ����ɂȂ�ł��傤���B
�@�X�e�b�v1�ł́A�ȑO�̃o�[�W������InstructGPT�ɓ��͂��ꂽ�v�����v�g���f�[�^�Z�b�g�Ƃ��āA���̈ꕔ�����o���A�����̃v�����v�g�����͂��ꂽ�Ƃ��Ƀ��f�����ǂ��U�镑���悢���i�ǂ�ȏo�͂��s���悢���j�A���̏o�͂Ƃ��Ė]�܂������̂�l�Ԃ��p�ӂ��Ă��܂��B�����āA�u�v�����v�g�Ɩ]�܂����o�́v�̑g�ݍ��킹���g���ċ��t����w�K���s���āAGPT���f�����t�@�C���`���[�����܂��iSupervised Fine-Tune�ASFT�j�B
�@�X�e�b�v2�ł́A���̃��f���ɑ��ĉ��炩�̃v�����v�g����͂��A�����������̏o�͂���ŁA�ǂ̏o�͂��]�܂������^�]�܂����Ȃ����A�l�Ԃ������N�t�������܂��B�����āA���̃f�[�^���g����V���f���̊w�K���s���܂��B
�@�X�e�b�v3�ł́AGPT���f���������w�K���܂��B���̂Ƃ��ɂ̓X�e�b�v2�ō쐬������V���f�����g���܂��B
�@���̂����A�X�e�b�v2�ƃX�e�b�v3���J��Ԃ����ƂŁA�v�����v�g�ɑ���o�͂Ƀ����N�t�����s�����f�[�^���V���������A���̌��ʁA��V���f�����X�V����A�����w�K������ɐi�ނƂ�������Ɋw�K���s���܂��B
�@���̂悤�Ɋw�K�̉ߒ��ɐl�Ԃ�g�ݍ����̂��u�q���[�}���E�C���E�U�E���[�v�v�ƌĂԂ��Ƃ�����܂��ˁB
�@���̂悤�ɂ��č쐬���ꂽ�̂�InstructGPT�ł��BChatGPT�͑Θb�ɓ����������f���ł��邱�Ƃ���A�w�K�Ɏg����f�[�^�̎��W���@�������قȂ��Ă��܂��B
�@�uChatGPT: Optimizing Language Models for Dialogue�v�ɂ��A�u���[�U�[��AI�Ƃ̑Θb���A�l�ԁiAI�g���[�i�[�j�������̗���Ńf�������f�[�^�v���X�e�b�v1�̃f�[�^�Ƃ��Ďg���܂��B����炪InstructGPT�̊w�K�Ŏg��ꂽ�f�[�^�Z�b�g�Ɠ�������A�Θb�̌`���ɕϊ����ꂽ���̂�GPT���f���̃t�@�C���`���[���iSFT�j�Ɏg���܂��B����ɃX�e�b�v2�ł�AI�g���[�i�[�ƃ`���b�g�{�b�g�Ƃ̑Θb����Ƀf�[�^���W�i�ƃ����N�t���j���s���܂��B����炪InstructGPT��ChatGPT�̃f�[�^���W���@�̈Ⴂ�ł��B
�@InstructGPT�ɂ��Ă�ChatGPT�ɂ��Ă��A�d�v�Ȃ͕̂�V���f���̊w�K�Ɏg����f�[�^�̃����N�t���ł��傤�B���f������̏o�͂̕i���ɉ����ă����N�t�����s�����ƂŁA�l�ɂƂ��ėL�p�ŊQ�̂Ȃ��o�͂��s���A��葽���̕�V�����炦��悤�Ƀ��f�����w�K���邱�ƂŃ��f������������e�L�X�g�����[�U�[�̈Ӑ}��w���ɉ��������̂ɂȂ�̂ł��B
�@����ɂ����AInstructGPT�ł̓��[�U�[����̓��́i�v�����v�g�j�ɑ��ă��f�����ǂ������o�͂�Ԃ��悢�̂����w�K�����邱�ƂŒP�Ɏ��ɏo�͂����g�[�N���i�P��j�𐄑�����Ƃ������f���ł͂Ȃ��A���[�U�[�̎w���ɍ������o�͂𐄑�����悤�ȃ��f���ɂȂ��Ă��܂��B�����āAChatGPT�ł͑Θb�`���̃f�[�^�Z�b�g���g�����ƂŁA�����Θb�ɓ����������̂ɂł��Ă���Ƃ������Ƃł��B���ꂪChatGPT�i��InstructGPT�j����̏o�͂��l�ԂɂƂ��čD�܂����o�͂ƂȂ��Ă���傫�ȗ��R�Ȃ̂ł��傤�B
�@����܂ŋ����w�K�͎����I�ȃQ�[������⎩�����s�ȂǂɎg���Ă��Ă��܂�ڗ����Ă��Ȃ������̂ŁA����Ȃӂ��Ɏg���Ėʔ����ł��ˁi��F�j�B
�@OpenAI�̃h�L�������g�uModel index for researchers�v�ɂ�GPT��InstructGPT�Ɋ֘A���郂�f���ɂ��Ă̐���������܂��i�c�O�Ȃ���ChatGPT�ɂ��Ă͂܂��L�ڂ��Ȃ��悤�ł��j�B
�@����ɂ���InstructGPT�Ɋ֘A���郂�f���ɂ͈ȉ��̂悤�Ȃ��̂�����܂��B
���f�� | ���� |
---|---|
code-davinci-002 | �R�[�h�����ɓK�������f���Btext-davinci-002�̃x�[�X |
text-davinci-002 | InstructGPT���f���Bcode-davinci-002���x�[�X |
text-davinci-003 | text-davinci-002�����P�������f�� |
InstructGPT�Ɋ֘A�������f�� |
�@���̃��f���ɂ��Ă͏�L�̃����N����Q�Ƃ��Ă��������B
�@Web��InstructGPT�������ɂ�OpenAI���p�ӂ��Ă���Playground�y�[�W���g���܂��iOpenAI�ւ̃T�C���A�b�v�^���O�C�����K�v�ł��j�B
�@��̉摜������Ε�����ʂ�A�����̑傫�ȋ���InstructGPT�ւ̓��͂Ƃ���ɑ���o�͂��\������܂��i���̔w�i�F�̃e�L�X�g��InstructGPT����̏o�͂ł��j�B�܂��A�E��́mModel�n���ɂ́utext-davinci-003�v�ƕ\������Ă���̂ŁAInstructGPT�̉��P�Ń��f���������ł͎g���Ă��邱�Ƃ�������܂��B
�@�����̑傫�ȋ��̉����ɂ́uLooking for ChatGPT?�v�Ƃ��邱�Ƃ���A�����Ŏg���Ă��郂�f����ChatGPT�ł͂Ȃ��Ƃ������Ƃ��z���ł��܂��ˁB
�@�ł́A�R�[�h����ȒP��InstructGPT���f�����g���Ă݂܂��傤�BOpenAI��InstructGPT��API�����J���Ă���̂ł�����Ăяo�������̃z���g�ɊȒP�ȃR�[�h�ł��i�m�[�g�u�b�N���������j�B
�@��肠�����R�[�h���o���Ă݂邱�Ƃɂ��܂����i�j�B
�@���̂��߂ɕK�v�Ȏ菇�͈ȉ��ł��B
�@API�L�[��OpenAI�ɃT�C���A�b�v�^���O�C��������ɁA�E��̃A�J�E���g�A�C�R�����N���b�N����ƕ\������郁�j���[����mView API keys�n��I�����܂��B
�@����ƁA�ȉ��̂悤�ȃy�[�W���\�������̂ŁA�mCreate new secret key�n�{�^�����N���b�N���Ă��������B
�@�����API�L�[���쐬����A���̂悤�ȃ_�C�A���O�ɃL�[���\������܂��B���̃L�[�͈�x�����\������Ȃ��̂ŁA�Y�ꂸ�ɃR�s�[���Ă����悤�ɂ��܂��傤�B
�@�����ăV�F����R�}���h�v�����v�g�A���邢��Visual Studio Code�Ȃǂ̊J�����̃V�F����R�}���h�v�����v�g����upip install openai�v�R�}���h�����s���邩�AJupyter�m�[�g�u�b�N�̃Z���Łu!pip install openai�v�����s���܂��B
�@����ŏ����͊����ł��B���openai���W���[�����C���|�[�g���A����api_key�����ɁA��قǐ������ꂽAPI�L�[�������A�Ō��openai.Completion.create�N���X���\�b�h���Ăяo�������ł��B�ȉ��ɗ�������܂��B
KEY = '�擾����API�L�[�������ɋL�q'
import openai
openai.api_key = KEY
response = openai.Completion.create(
model='text-davinci-003', # InstructGPT
prompt='���ꂽ���j���̌ߌ�ɂ͉�������������ȁH',
temperature=0.7,
max_tokens=256,
top_p=1,
frequency_penalty=0,
presence_penalty=0
)
print(response['choices'][0]['text'])
�@InstructGPT��API���Ăяo���̂ŁAmodel�����ɂ�'text-davinci-003'���w�肵�܂��Bprompt�ɂ͐�ق�Web�Ŏ������̂Ɠ���'���ꂽ���j���̌ߌ�ɂ͉�������������ȁH'���w�肵�܂����B���̑��̈����ɂ��ẮuCreate completion�v���Q�Ƃ��Ă��������B
�@���s�������ʂ��ȉ��Ɏ����܂��B
�@���g�̂��Ƃ͂悭������Ȃ��Ă��AAPI���Ăяo������Ȃ�̓������Ԃ��Ă���Ƃ����̂͊y�ł����ł��ˁi�j�B
�@����͊ȒP�ł��ˁBPython�ȂǂŃ\�t�g�E�F�A�̃v���O������������l�͑����Ǝv���̂ŁA�����̐l���������ƂŎv�������Ȃ��ʔ������p���@��\�����[�V�����̃A�C�f�A����������o�Ă��������Ǝv���܂����B
�@�Ƃ����킯�ŁA�����InstructGPT��ChatGPT�Ƃ���2�̃��f�����ǂ�Ȃӂ��ɍ���Ă��邩�����Ă��܂����B����͉������邩����ł����A�����ʔ������Ƃ��ł�����Ǝv���Ă��܂��B
�uChatGPT�����v
Copyright© Digital Advantage Corp. All Rights Reserved.