昨日までは、Google の Index に、まったく含まれていなかったのですが、今朝になって、site:kazmuzik.net で検索すると、24 ページ含まれていました。しかし、含まれているページには、かなり偏りがあり、top page も含まれていないため、別のサイトからのリンクで、一部だけ crawl (fetch) されたようです。(*)
そこで、sitemap を作成して、登録することにしました。下記のように、テキストの sitemap ファイルを作成しました。
$ find . -name '*.html' -print \ | sed \ -e 's/^./http:\/\/kazmuzik.net/' \ -e 's/\/index.html$/\//' \ | sort -u \ > sitemap.txt $ |
831 URL(s) ありました。Tag の URL で、Latin-1 を含むものが 2つ、漢字を含むものが 3つあったので、それらはマニュアルで修正しておきました。
Google の Index に含まれないと、次のステップに行けないので、早く crawl してほしいところです。
2008-03-09 19:30 update
(*) 夕方になり、292 ページになっていました。右上の、検索ボックスからの検索結果も、それっぽくなってき
Tags: computer_technology