Hadoop���͂��߁AJava������g���č\�z����邱�Ƃ������u�r�b�O�f�[�^�v�����̂��߂̃t���[�����[�N�^���C�u�������Љ�Ȃ���A��ʃf�[�^�����p���邽�߂̋Z�p�̏펯��g�ɕt���Ă����A��
�@Apache Hadoop�i�ȉ��AHadoop�j�̓o��ŁA���܂Ŏ̂ĂĂ����f�[�^�A���߂邾���ŏ���������Ȃ������f�[�^�����p�ł���悤�ɂȂ�܂����B
�@���p��i�Ƃ��čŋ߂Ƃ݂ɒ��ڂ���Ă���Z�p���u�@�B�w�K�v�ł���AHadoop�̋��݂����ȒP�ɋ@�B�w�K���s�����߂����C�u�������A�uApache Mahout�v�i�ȉ��AMahout�j�ł��B
�@�{�e�ł�Mahout�����Ă݂邱�ƂŁA�@�B�w�K�̏펯��g�ɕt���܂��B
�@�@�B�w�K�Ƃ́A���̃f�[�^���R���s���[�^�E�v���O�����Ɂu�w�K�v�����i���Ȃ킿�A���̃f�[�^�ɐ��ރp�^�[����K������\���u���f���v�������I�ɍ\�z�����j�A���̃f�[�^�ɂ��̃��f����K�p����A���������l�Ԃ̂悤�ɕ��G�ŏ_��Ȕ��f���s����悤�ɂ���Ƃ������݂ł��B
�@�@�B�w�K���r�W�l�X�Ɋ��p������́A���R�����h�i���[�U�[�⏤�i�̗ގ��x���w�K�j�A���f���[�������i�ߋ��ɖ��f���[���Ƃ��ꂽ���̂̃p�^�[�����w�K�j�A���[�U�[�s�������i�]�܂����^�]�܂����Ȃ����ʂɎ���s���p�^�[�����w�K�j�A�摜�����Ȃǂ��悭�����܂��B
�@�@�B�w�K���̂��̂�1960�N�ケ��A�u�l�H�m�\�v�̌����Ɏn�܂钷�����j�������A�r�W�l�X�ɂ��ȑO���痘�p����Ă��܂����B
�@���ꂪ�A�Ȃ������ڂ��W�߂Ă���̂ł��傤���B
�@�@�B�w�K���A���S���Y���i���f�����\�z�E�K�p���郍�W�b�N�j�͐��̐��قǂ���܂����A��ʂɎ��̓����������܂��B
�@�܂�A���x��Nj�����ƃ������e�ʂ̕ǁA�������Ԃ̕ǂɓ˂�������킯�ł��B���U���������܂��g���A���̕ǂ�Ŕj�ł��܂����A���̃n�[�h���͔��ɍ������̂ł����B
�@�Ƃ��낪�A����Hadoop�ɂ���ĕ��U�����̃n�[�h���̓O�b�Ɖ�����܂����B����܂ł�����߂Ă�����ʂ̃f�[�^�ɂ��@�B�w�K�������I�ȑI�����ɂȂ�A�����p�I�Ȑ��x�̌��ʂ����҂ł���̂ŁA���炽�߂ċ@�B�w�K�����ڂ���Ă���̂ł��B
�@��IT�ł��u�e�L�X�g�}�C�j���O�Ŏn�߂���HHadoop���p�v�Ƃ��āAHadoop�^MapReduce�ɂ��@�B�w�K�v���O���~���O���Љ�Ă��܂��B�������A����Ɏ�y�ɁAMapReduce�v���O�����������Ȃ��Ă��A���C�u�������g�����Ƃɂ���ĕ��U���ŋ@�B�w�K���s����悤�ɂ��悤�A�Ƃ����̂�����̖ڕW�ł��B
�@�@�B�w�K���C�u�����͐��������݂��܂����A�{�e�ł͗�Ƃ���Mahout���g���܂��B
�@�uMahout�v�́AHadoop�̃X�P�[���r���e�B�����A�r�b�O�f�[�^��p�����@�B�w�K���\�ɂ��郉�C�u�����ł��B���R�����h�A�N���X�^�����O�Ƃ������@�B�w�K�̃A���S���Y����MapReduce�Ŏ�������Ă���A�R�}���h�E���C����API����p�����[�^���w�肷�邾���ŁA�����𗘗p�ł��܂��B
�@����i2012�N2��6���j�����[�X���ꂽ0.6�łł�20��قǂ̃A���S���Y��������Ă��܂��B���ł����A���̈�ʓI�ȋ@�B�w�K���C�u������\�t�g�E�G�A�Ɍ���肵�܂����A�v���O��������炸�Ƃ�100��������悤�ȑ�K�̓f�[�^�������ł���̂͑傫�ȋ��݂ł��B�܂��A���o�[�W�����Ɍ����Ċ����ɊJ�����i�߂��Ă��܂��B
�@���Ȃ݂ɁAMahout�̓q���f�B�[��R���́u�ێg���v�Ƃ����Ӗ��Łu�}�n�E�g�v�Ɠǂ݂܂��B�ہiHadoop�j�̏�ŁA���̋��́i�f�[�^�j�𑀂�C���[�W���疽�����ꂽ�̂ł��傤�B
�@Mahout�ɂ��āA����ɏڂ����m�肽�����ɂ́A�ȉ��������߂��܂��B
�@Mahout�̃C���X�g�[���͊ȒP�ł��BHadoop���K�v�ł����A�������s���镪�ɂ͓�����jar���g���̂ŁA�ʒi�̏����͗v��܂���BJava 1.6�ȏ������ϐ��uJAVA_HOME�v�ɐݒ肳��Ă�����ł���A�o�C�i���z�z�ł��_�E�����[�h�A�W�J���邾���œ����܂��iWindows�ł�mahout�V�F���X�N���v�g�����s���邽�߂ɁA�܂�Hadoop��UNIX�R�}���h�𗘗p���邽�߂�Cygwin���K�v�ł��j�B
�@������s����ɂ́A���炩����Hadoop���C���X�g�[���i���ϐ��uHADOOP_HOME�v�A$HADOOP_HOME/conf��ݒ�j���A���R�ł����Q�Ɛ��Hadoop�N���X�^���N�����Ă����K�v������܂��B
�@�R�}���h�E���C������͈ȉ��̂悤�ɁA�W�J����bin�f�B���N�g���ɂ���mahout�V�F���X�N���v�g�ɃR�}���h�i�����ł́Akmeans�j�A���o�̓f�B���N�g����R�}���h�ŗL�̃p�����[�^��n���Ď��s���܂��B
$MAHOUT_HOME/bin/mahout kmeans \ -i {���̓f�B���N�g��} \ -o {�o�̓f�B���N�g��} \ -dm {�����v�Z���@> \ -c {�������S�_} \ -cd {�v�Z�I����臒l} \ -x {�ő�J��Ԃ���} \ -cl {�Ō�Ɋe�_�̋A���N���X�^�����߂�} \ -xm {���s���@�i����|����j}
�@Java�v���O����������A�e�R�}���h�ɑΉ����ėp�ӂ���Ă���h���C�o���g���ē����悤�Ɏ��s�ł��܂��B
KMeansDriver.run(Path input, Path clustersIn, Path output, DistanceMeasure measure, double convergenceDelta, int maxIterations, boolean runClustering, boolean runSequential)
�@���̂悤��Mahout�́A�ƂĂ��ȒP�ɗ��p�ł��܂��B���������p�҂́A�f�[�^��p�ӂ��A�K�ȃA���S���Y����I�сA���s��ʂ��ēK�ȃp�����[�^�̒l��T�����Ƃɒ��͂ł��܂��B
�@���y�[�W����́AMahout�𗘗p���ċ@�B�w�K���s����������Ă����܂��傤�B
Copyright © ITmedia, Inc. All Rights Reserved.