新しいページを探して絶えずウェブを巡回するGoogleの強力な検索ボットが、インデックス付けを新たに強化し始めた。
Googleの巡回・インデックス付け担当チームのJayant Madhavan氏とAlon Halevy氏は米国時間4月11日付けのブログ投稿の中で、同社のインデックスソフトウェアが試験的にウェブサイトのフォームにテキストを入力して、以前は見つからなかったページが表示されるかを調べる実験を開始したと書いている。
「Googleユーザーのために、従来の方法では見つけることもインデックスを付けることもできなかった新しいウェブページやURLを発見しようと、この2〜3カ月、HTML形式のフォームをいくつか調べてきた。Googleはウェブの検索範囲拡大に向けて取り組みを強化しており、この実験はその一環だ。実際、HTML形式のフォームは、検索エンジンの通常の対象範囲に含まれていない大量のデータにつながる入口になるだろうということは長年考えられてきた」とMadhavan氏とHalevy氏は書いている。
Googleの新しいインデックス付け作業は、「質の高い」ウェブサイトだけを対象とし、「robots.txt」などインデックスソフトウェアを回避する標準的なシステムを採用しているサイトには行われない。
Googleによれば、フォームに「入力」するキーワードを決めるために、インデックスソフトは、同じフォームがあるウェブページのキーワードをサンプリングするという。
Anand Rajaraman氏のブログ投稿によると、この技術は、Googleが買収したTransformicという企業に関係しているようだ。Rajaraman氏は、かつてHalevy氏のもとで同技術にかかわったことがあるという。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」