�����G���W���̏펯��Apache Solr�Őg�ɂ‚����F�r�b�O�f�[�^�����̏펯��Java�Őg�ɂ‚���i1�j�i1/4 �y�[�W�j

Hadoop���͂��߁AJava������g���č\�z����邱�Ƃ������u�r�b�O�f�[�^�v�����̂��߂̃t���[�����[�N�^���C�u�������Љ�Ȃ���A��ʃf�[�^�����p���邽�߂̋Z�p�̏펯��g�ɕt���Ă����A��

» 2011�N11��18�� 00��00�� ���J
[�ɓ��h�F�C������Ѓ~�N�V�B]

�S�������G���W���ƁuApache Solr�v

�@���݁A������Web�T�[�r�X�ɂ͌��������t���Ă��܂��B���[�U�[�͌������������N�G���𔭍s���邱�ƂŁA����Web�T�[�r�X���ێ����镶���W�����狻���̂��镶�������ł��܂��B

�@���̂悤�Ȍ����@�\���������邽�߂ɁAWeb�y�[�W�̃o�b�N�G���h�ł́A�u�S�������G���W���v�������āA���[�U�[�����s�����N�G���Ƀq�b�g����i�N�G�����܂ށj�����W���̏ꏊ�iURL�Ȃǁj�����[�U�[�ɕԂ��Ă��܂��B

}1@T[rX �}1�@�����T�[�r�X

�@�{�e�ł́A�܂��i�S���j�����G���W���Ƃ��̎��ӋZ�p�ɂ‚��Ă��b�����܂��B���̌�uApache Solr�i�\�[���[�j�v�i�ȉ��ASolr�j�Ƃ����I�[�v���\�[�X�̌����G���W���̗��p���@�ɂ‚��ĊȒP�ɉ�����܂��BSolr��Java�����ŏ����ꂽ�����G���W���ō����O�̑�K�͌����T�[�r�X�ŗ��p���т������܂��B


�����G���W���ŗ��p�����Ȏ�@

�@�����G���W���́A���[�U�[�����s���錟���N�G���ɑ΂��č����Ɍ��ʂ�Ԃ��K�v������܂��B���݂܂łɍ����Ȍ������������邽�߂̎�@�������‚���Ă���Ă��܂����B

�@�ł��P���Ȏ�@�́A�N�G�����s��A�����Ώۂ̕���1��1�‚��u�N�G���P���v���܂�ł���̂��`�F�b�N������̂ł��B���̎�@�͔��ɊȒP�Ɏ����ł��i�P���ɂ́ugrep�v�R�}���h�Ŏ����ł��܂��j�֗��ł����A�N�G�����s��ɑΏە����W���𑖍����邽�߁A�u�ΏۂƂȂ镶���̐����傫���Ȃ�ƁA�����Ɏ��Ԃ�������߂���v�Ƃ�����肪����܂��B

�C���f�b�N�X

�@����ɑ΂��A�u�C���f�b�N�X�v�𗘗p����ƁA��ʂ̕����W���������Ɍ����ł��܂��B�����ł����C���f�b�N�X�́u�ǂ̕������A�ǂ̒P����܂ނ̂��v�Ƃ�������ۑ�����e�[�u���ł��B���[�U�[���N�G���𔭍s�����ہA�C���f�b�N�X�����Œ����G���W���͎��g�̃C���f�b�N�X�𒲂ׂăN�G���P����܂ޕ����W����Ԃ��܂��B

�@�C���f�b�N�X�𗘗p���邱�ƂŁA�N�G�����܂ޕ��������W���鎞�Ԃ�Z�k�ł��܂��B�C���f�b�N�X�𗘗p���������V�X�e���ƑS�����̃R���e���c�𑖍����錟���V�X�e�����r����ƁA�����̏ꍇ�C���f�b�N�X�𗘗p���������V�X�e���̕��������ɓ��삵�܂��B

�@�܂��A�����ΏۂƂȂ镶�����i�ʁj���傫���Ȃ��Ă��A�������\�͂���قǗ򉻂��܂���i���F���m�ɂ͌����G���W����ێ�����v�Z�@�̃������ʂƃC���f�b�N�X�̑傫���ȂǂɈˑ����܂��j�B

�@���̂��߁A��K�̓f�[�^�����������ׂȊ‹��ł́A�C���f�b�N�X�̗��p���u�قڕK�{�v�Ƃ����܂��B

�@�C���f�b�N�X�̃f�[�^�\���ɂ́A�����‚���ނ�����܂��B���̒��ł��u�]�u�C���f�b�N�X�v�i��1�j�����ɗL���ł��B���̑��ɂ��u�ڔ����z���v�i��2�j���C���f�b�N�X�Ƃ��ė��p���������G���W�������݂��܂��B�ȉ��̐߂œ]�u�C���f�b�N�X�ɂ‚��Đ������܂��B

  • ��1[Knuth, 1997] Donald Knuth, The Art of Computer Programming, Volume 3: Sorting and Searching, Third Edition. Addison-Wesley, 1997.
  • ��2[Manber and Myers, 1991] Udi Manber and Gene Myers (1991). "Suffix arrays: a new method for on-line string searches". SIAM Journal on Computing, Volume 22, 1993.

�]�u�C���f�b�N�X

�@�]�u�C���f�b�N�X�͊e�P��ƒP����܂ޕ���ID����Ȃ�e�[�u���ł��i���F���ۂɂ͒P�ꂪ�����̒��ŏo�������ʒu�����܂ޏꍇ�������̂ł����A�{�e�ł͊������܂��j�B

�@�Ⴆ�΁A2�‚̉p��̕����iDoc 1,Doc2�j������A���̃R���e���c�����ꂼ��uI love Emacs�v�uI prefer Vim to Emacs�v�ł������Ƃ��܂��B���̂Ƃ��A�ȉ��̕\�̂悤�ȓ]�u�C���f�b�N�X�𐶐����܂��B�����ɗ��p����]�u�C���f�b�N�X�́u�A�z�z��v�Ƃ����f�[�^�\���Ŏ����ł��i���F�A�z�z��łȂ�����������܂��j�A�P����L�[�ɂ��ĕ���ID �̃��X�g��Ԃ��܂��B

�P�� ����ID���X�g
I 1,2
love 1
Emacs 1,2
prefer 2
Vim 2
to 2
�\�@�]�u�C���f�b�N�X�̗�

�@�\�̂悤�ȓ]�u�C���f�b�N�X������́A�N�G���ɑ΂��錋�ʂ�Ԃ������͊ȒP�ł��B�Ⴆ�΁A���[�U�[���uVim�v�Ƃ����N�G���𔭍s����ƁA�����G���W���́uVim�v���܂ޕ���ID���X�g��Ԃ��܂��B�\�ł͕���ID�́u2�v��Ԃ��܂��B

�����G���W������芪��7�‚̋Z�p

�@�����G���W���̃R�A�Z�p�͑O�߂ŏЉ���C���f�b�N�X�ł��B���������ۂɁA�����C���f�b�N�X�����ō\�����錟���G���W������A�����T�[�r�X���\�z����ɂ͑���ȃR�X�g���|����܂��B�ȉ��̐߂Ō����G���W���𗘗p�����V�X�e���A�����T�[�r�X���\�z����ۂɕ֗��ȃR���|�[�l���g���Љ�܂��B

�@�����̋@�\�̂����‚��́A�����̌����G���W�����g�ݍ���ł��܂��B����ŁA�ȑf�Ȍ����G���W���́A�ȉ��ŏЉ��R���|�[�l���g���T�|�[�g���Ă��Ȃ����߁A���[�U�[���Ǝ��ɊJ�����邩�A���̋@�\�����ƒR���|�[�l���g��g�ݍ��ޕK�v��������̂�����܂��B

�y1�z�g�[�N�i�C�U

�@�����G���W���ɕ������C���f�b�N�X����ɂ́A���͕������̕���P��ɕ�������K�v������܂��B���̍�Ƃ��s���̂��u�g�[�N�i�C�U�v�Ƃ����R���|�[�l���g�ł��B�g�[�N�i�C�U�ɂ́A���͕�����P��i�`�ԑf�j�ɋ�؂�u�P��P�ʁv���̂Ɓu(�����jN-gram�v��2��ނ�����܂��B

  • �P��P�ʂ̃g�[�N�i�C�U

�@�܂��u�P��P�ʂ̃g�[�N�i�C�U�v�i���F�u�`�ԑf��͊��v�Ƃ����c�[�����w���j�ɂ‚��Ă��b�����܂��B��قǂ̗�ň����������͉p�ꂾ�����̂ŁA�e�P��ԂɃX�y�[�X�������Ă��܂����B���̂��߁A�e�P������o���̂͊ȒP�ł��B�Ƃ��낪�A���{��⒆����͊e�P��̐؂�ڂɃX�y�[�X�������Ă��Ȃ����߁A�]�u�C���f�b�N�X�𐶐�����O�ɕ�����P���؂�o���K�v������܂��B

�@�Ⴆ�΁A�u���͍���c�����ɍs���܂����v�Ƃ���������P��P�ʂ̃g�[�N�i�C�U�ŏ�������ƁA�u"��","��","����c����","��","�s��","�܂���"�v�Ƃ����P�����o�͂��܂��B�����̒P����C���f�b�N�X���Ă������ƂŁA���[�U�[���u����c�����v�Ƃ����N�G���𔭍s�����ہA�u����c�����v�Ƃ����P����܂ޕ�����Ԃ��܂��B

�@�������A�P��P�ʂ̃g�[�N�i�C�U�𗘗p�����C���f�b�N�X�ɂ́A�L���Ȗ�肪����܂��B����́u�����N�G���Ƀq�b�g���Ȃ��v�ꍇ������Ƃ����_�ł��B

�@�Ⴆ�΁A��̈ꕶ����Ȃ镶���A�u���͍���c�����ɍs���܂����v���C���f�b�N�X���������Łu����v�Ƃ����N�G�������[�U�[�����s�����ꍇ�A�����̓q�b�g���܂���B�Ȃ��Ȃ�u����c�����v�Ƃ����������u����v�u�c�����v�Ƃ���2�P��Ƃ��ăC���f�b�N�X�����ɁA�g�[�N�i�C�U���u����c�����v��1�‚̒P��Ƃ��ďo�͂������߂ł��B

�@���̂悤�Ƀg�[�N�i�C�U���P���傫���؂�o���Ă��܂��������߂ɁA�������ʂɏo�Ă��Ăق����P�ꂪ�q�b�g���Ȃ��Ƃ����󋵂�����܂��B���̖�������邽�߂ɁA���p�̃g�[�N�i�C�U�̒��ɂ͒P����ׂ�����������@�\��P��̒��̕����P����o�͂���@�\��񋟂��Ă�����̂�����܂��B�܂��A�ȉ��ŏЉ�܂��uN-gram�g�[�N�i�C�U�v�𗘗p���邱�ƂŁA���̖��������ł��܂��B

  • �i�����jN-gram �g�[�N�i�C�U

�@N-gram�g�[�N�i�C�U�𗘗p���ăC���f�b�N�X����邱�ƂŒP��x�[�X�̃g�[�N�i�C�U�ŋN�������u�����N�G���Ƀq�b�g���Ȃ��v�Ƃ������������ł��܂��BN-gram �ł͕����un-�����v�P�ʂɕ������āi�I�[�o�[���b�v���܂ށj�C���f�b�N�X���܂��B

�@�Ⴆ��2�����P�ʁi�o�C�O�����j�Łu����c�����v�𕪊�����Ɓu"����","��c","�c��","����"�v�ƂȂ�܂��B���̂悤��N-gram�𗘗p����ƁA�u����c�����v�Ƃ����P����܂ޕ����́u����v�Ƃ���������������C���f�b�N�X���邽�߁A���[�U�[���N�G���u����v�Ō��������ہA�����������ʂ�Ԃ��܂��B

�@�������AN-gram�ɂ́u�����Ƀq�b�g���Ăق����Ȃ��������܂܂��v�Ƃ�����肪����܂��B�Ⴆ�΁u����c�����v���܂ޕ���N-gram�ŃC���f�b�N�X�����Ƃ��܂��B�c�O�Ȃ��ƂɃ��[�U�[�����s����u��c�v�Ƃ����N�G���̌������ʂɁA���̕������܂܂�Ă��܂��܂��B����́u����c�����v���u"����","��c","�c��","����"�v�̂悤�Ɂu��c�v���܂�2�����g�i2-gram�j�ɕ������Ă��܂�������ł��B

�@����ɁAN-gram�C���f�b�N�X�̓g�[�N�i�C�U�C���f�b�N�X�����C���f�b�N�X�̃T�C�Y���傫���Ȃ�X��������܂��B���ʁA����̕����W���ŒP��x�[�X�̃g�[�N�i�C�U��N-gram�ŃC���f�b�N�X�𐶐������ꍇ�ɂ́A�P��x�[�X�̕����������\�i�X�s�[�h�j���ǍD�ȌX��������܂��B

  • �P��P�ʁ{�i�����jN-gram �g�[�N�i�C�U

�@�����G���W���ɂ���Ă͗��҂̍��킹�Z�I�ȕ��@���g���܂��B��̓I�ɂ́A�P��x�[�X�ƕ���N-gram�̗����̃C���f�b�N�X�𐶐�����@�\�ł��B���̋@�\�ɂ���āA�uN-gram�C���f�b�N�X�ŃN�G���P����܂ށi�q�b�g����j�����W�����W�߁A�g�[�N�i�C�U�C���f�b�N�X�Ńq�b�g�����������ʂɃ����L���O���s���v�Ƃ��������������ł��܂��B

�@���y�[�W�ł́A�����G���W������芪���Z�p�c��6�‚ɂ‚��ĉ��������A�����G���W���̎�ȗ��p���@�ɂ‚��ďЉ�܂��B

�@�@�@�@�@�@ 1|2|3|4 ���̃y�[�W��

Copyright © ITmedia, Inc. All Rights Reserved.

'; this.insertTarget = document.querySelector('#cmsBody .subscription') || document.querySelector('#cmsBody .inner'); }; BodyAdIMSWithCCE.prototype = Object.create(BodyAdContent.prototype); BodyAdIMSWithCCE.prototype.activate = function () { refreshGam('InArtSpecialLink'); } // global reference window.itm = itm; //entry point BodyAdEventBase.polyfill(); const bodyAdManager = BodyAdManager.getInstance(); bodyAdManager.addEventListener(BodyAdManager.EVENTS.READY, function (ev) { bodyAdManager.loadAdvertise(); }); bodyAdManager.init(); })();
�X�|���T�[����̂��m�点PR

���ڂ̃e�[�}

Microsoft  WindowsőO2025
AI for GWjAO
[R[h^m[R[h Zg by IT - ITGWjArWlX̒SŊ􂷂gD
Cloud Native Central by IT - XP[uȔ\͂gD
�V�X�e���J���m�E�n�E �y�����i�r�zPR
���Ȃ��ɂ������߂̋L��PR

RSS�ɂ‚���

�A�C�e�B���f�B�AID�ɂ‚���

���[���}�K�W���o�^

��IT�̃��[���}�K�W���́A �������A���ׂĖ����ł��B���Ѓ��[���}�K�W�������w�ǂ��������B