ITmedia NEWS > �l�b�g�̘b�� >

�u�X�g�����`�E���v���u�X�m�����`�E���v�́uOCR�̃~�X�v�@���q�͋K�����A�T�C�g���C��

» 2014�N06��10�� 12��03�� ���J
[ITmedia]

�@���q�͋K���ψ��Web�T�C�g�Ō��J���Ă��鎑���̒��ŁA�u�X�g�����`�E���v�́u�g�v�Ɓu���v�������́u�m�v�i�ڂ��j�Ɓu���v�i�����j�ɂȂ��Ă����ƃl�b�g���[�U�[�Ɏw�E����A�T�C�g�����J���Ă��錴�q�͋K�������C�����鑛�����������B�摜PDF���e�L�X�g������ہA�����F���iOCR�j�\�t�g���Ԉ����������F�����Ă��܂������Ƃ������Ƃ����B

摜 �뎚���������y�[�W�B10���܂łɏC������Ă���

�@�뎚���������̂́A���N1���ɊJ���ꂽ�u��10����茴�q�͎{�݊Ď��E�]������������΍􌟓����[�L���O�O���[�v�v����c�����ꗗ�y�[�W�B�u������ꌴ�q�͔��d���ɂ�����X�g�����`�E�����͂̏󋵂ɂ‚���[�����d��]�v�Ƃ��������́u�g�v�Ɓu���v�����ꂼ�ꊿ���ɂȂ��Ă���A�u���������̂��߂ɂ����Ċ����ɂ����̂ł́v�Ȃǂƈꕔ�l�b�g���[�U�[�̊Ԃő����ɂȂ��Ă����B

�@�����ɂ��ƁAWeb�T�C�g�Ɍf�ڂ���e�L�X�g�͒ʏ�A��ł��Ŋm�F���Ă��邪�A���̉�c�͎������͂����^�C�~���O���M���M�����������߁A�摜PDF���X�L�������AOCR�\�t�g�ɂ����ăe�L�X�g���������̂����̂܂ܓ\��t�����Ƃ����B�f�ڎ��ɖڎ��Ŋm�F�������A�u�g�v�Ɓu���v���Ⴄ���ƂɋC�Â����ɃA�b�v���Ă��܂����Ƃ����B

�@�l�b�g���[�U�[����̎w�E���󂯁A6��9���ɕ������C���B���킹�āA�����T�C�g��HTML�ɂق��ɓ��l�ȊԈႢ�i�u�L�v�Ɓu��v�̃~�X�A�u�́v�i������j�Ɓu�J�v�i�J�^�J�i�̃J�j�̃~�X�Ȃǁj���Ȃ����`�F�b�N�����Ƃ���A���‚���Ȃ������Ƃ����B�����̍L��S���҂́u������̃~�X�Ő\����Ȃ��v�Ƙb���Ă���B

�@���̂ق��A�u�����d�́v��u���q�́v�́u�́v���J�^�J�i�́u�J�v�ɕς���Google��������ƁA�֘A��PDF�������o�Ă��邱�Ƃ��b��ɂȂ����B�������摜PDF��OCR�\�t�g�ɂ������ۂ̕ϊ��~�X�������Ƃ݂���B

Copyright © ITmedia, Inc. All Rights Reserved.

'; e_dlv.innerHTML = html; adRequest({position:dlv_pos,dom:true}); }else if(ad_type === 'gam'){ var html = '
'; e_dlv.innerHTML = html; refreshGam('InArtSpecialLink'); }else if(ad_type === 'logly'){ var html = '
'; e_dlv.innerHTML = html; loglySet(g_id); }else if(ad_type === 'google'){ var html = '
'; e_dlv.innerHTML = html; googletag.cmd.push(function(){ var slot8 = googletag.defineSlot('/43042345/nlab_artinsert_RT',[[336,280],[300,250],'fluid'],'div-gpt-ad-1551176482959-0').addService(googletag.pubads()); googletag.pubads().enableSingleRequest(); googletag.enableServices(); googletag.display('div-gpt-ad-1551176482959-0'); googletag.pubads().refresh([slot8]); }); } }; var insert_ok = function(_target,_str){ var clearfix = d.createElement('div'); clearfix.className = 'colBoxClear'; if(ad_float_fix){ e_body.insertBefore(e_dlv,_target); e_body.insertBefore(clearfix,_target.nextElementSibling); }else{ e_body.insertBefore(e_dlv,_target); } set_dlv(); }; var insert_ng = function(_str){ e_dlv.style.display = 'none'; }; var main = function(){ var e_nodes = e_body.childNodes; // BODY �����q�v�f var e_tags = []; // BODY �����^�O var p_num = []; // BODY ���� P �^�O�ʒu var p_target_num; // �g�}����ʒu var o_float = {}; // ��荞�ݗv�f var o_this = {}; // �A�N�e�B�u�^�O var o_next = {}; // �A�N�e�B�u�^�O�̎��̃^�O var flag_insert = 0; // �}���t���O // ��荞�ݗv�f�`�F�b�N var check_float = function(_e){ var e = 0; if(_e.id.match(/^col\d{3}(l|r)$/)){ e = _e; } return e; }; // �v�f�� Y ���W�ƍ����̍��v�l var get_element_y = function(_e){ var ey = 0; var eh = _e.offsetHeight; while(_e){ ey += _e.offsetTop; _e = _e.offsetParent; } return ey + eh; }; var check_ptag = function(_e){ var e = 0; if(_e.tagName && _e.tagName === 'P'){ e = _e; } return e; }; var try_insert = function(){ p_target_num = Math.floor(p_num.length / 2) - 1; if(p_target_num >= _maxrange) p_target_num = _maxrange; if(dis_con) p_target_num = 0; for(var i = p_num[p_target_num]; i < e_tags.length; i++){ o_this.e = check_ptag(e_tags[i]); if(o_this.e){ o_next.e = check_ptag(e_tags[i + 1]); if(o_next.e){ if(!o_float.e || check_float(e_tags[i - 1])){ o_float.e = check_float(e_tags[i - 1]); o_float.n = i - 1; } if(o_float.e && o_float.n < i + 1){ o_float.y = get_element_y(o_float.e); o_this.y = get_element_y(o_this.e); set_line(o_float.y,'red'); set_line(o_this.y,'blue'); if(o_float.y < o_this.y){ flag_insert = 1; insert_ok(o_next.e,_threshold + ' �p���ȏ��荞�݂���'); break; } }else{ flag_insert = 1; insert_ok(o_next.e,_threshold + ' �p���ȏ��荞�݂Ȃ�'); break; } } }else{ o_float = {}; } } if(!flag_insert){ insert_ng('�}���ʒu�Ȃ�'); } }; // �S�q�v�f����^�O�̂ݔz��ɓ���� for(var i = 0; i < e_nodes.length; i++){ if(e_nodes[i].tagName){ e_tags.push(e_nodes[i]); } } // �S�^�O���� P �^�O�ʒu��z��ɓ���� for(var i = 0; i < e_tags.length; i++){ if(e_tags[i].tagName === 'P') p_num.push(i); // �ŏ��̉�荞�ݗv�f���i�[ if(!o_float.e){ o_float.e = check_float(e_tags[i]); o_float.y = get_element_y(o_float.e); o_float.n = i; } } if(p_num.length >= _threshold){ try_insert(); }else{ insert_ng('P �^�O ' + _threshold + ' �ȉ�'); } }; if(e_body){ main(); }else{ insert_ng('�L���{���Ȃ�'); } })(document,4,5);