自分のサイトに乗せてはまずいものが乗っているのに気づき、ファイルそのものは消したのですが、検索サイトのキャッシュに情報の残ってしまっています。
これをすべて消すにはどうしたらいいのでしょうか?Googleのサイトにあったようにrobots.txtは配置して、申請しましたが、ほかのYahooなどの検索サイトにもあるようでした。
これらをすべて消したのですが、まず
・どこに掲載されているか知る方法
・なるべく早く消す方法
を教えてください。
よろしくお願いします。
> ・どこに掲載されているか知る方法
アクセスログが取れるのであればリファラをチェックしてキャッシュページから来ている物を探せば見つかります。
(ただしキャッシュされたページからリンクされている自サイトへのリファラになります)
> ・なるべく早く消す方法
そのサイトに消す方法が書かれていない場合は、運営会社に連絡するしかないでしょう。その時、可能であればメールよりも電話の方が早く対応して貰えると思います(嫌がられるとは思いますが)。
http://www.archive.org/web/web.php
Internet Archive: Wayback Machine
過去の情報を真っ先に消したいのであればWebBackを確かめて該当している場合は申請しなければYahoo!から消去されても永遠に残ると思います。
ありがとうございます。
@ITでいい記事見つけましたのでご覧になってみてはどうでしょうか?
PortSwigger.net - web application hack tools
ありがとうございます。
もしHTMLで書かれたファイルであれば、ヘッダーに
<meta http-equiv=”Cache-Control” content=”no-cache”>
を含むファイルを、のせてはまずいものが書かれていたファイルと同じ名前にして置いておけば、botがクロールしたときにこの情報を見てキャッシュを消すはず。
急ぐならばそのファイルのURLを”サイトの登録 / 削除”で送っておけばより確実。
ありがとうございます。
すいません、ヘッダーの件、間違いました。
<meta http-equiv=”Cache-Control” content=”no-cache”>
ではなくて
<meta name=”robots” content=”noindex,nofollow”>
です。
ありがとうございます
http://search.msn.co.jp/docs/submit.aspx
Live サーチ URL の登録
Schuzakさんが回答された方法が、一番確実でしょう。
登録申請先は、参考URLを参照してください。
問題は、Ask.jpですね。
クロールを促す手段がありませんので、クロールしてくれるのを待つしかありません。急ぐんだったら、メールで直接問い合わせた方がいいかもしれません。
http://submit.search.yahoo.co.jp/add/request
ログイン - Yahoo!検索
http://static.ask.jp/docs/help/help_siteregistered.html
サイトの登録 / 削除:アスク ドット ジェーピー
ありがとうございます。
なるほど。ありがとうございます。