ヤフーのキャッシュ日付とクロール日表示 その2

SERPsのキャッシュ日付に関する検証

『ヤフーのキャッシュ日付とクロール日表示 その1』の続きです。

検証1:通常のHTML

キャッシュ日付が1/5となっていたメインサイトであるSEO対策のindex.htmlを少し変更した上で更新しクロール日付の変化を見ます。

これで1/17になった場合にはキャッシュ日付=更新日という事になり、1/18以降となった場合にはクロール日(+α)という事になります。

1/19現在、日付キャッシュともに1/5のままです。

検証2:ブログ(WordPress)

ブログパーツや広告が一切無い独自ドメインブログの更新を完全にストップ(プラグインのアップやサイドバーの変更など全てを停止)した状態でキャッシュ日付の変化を見ます。

これで一向に変化しない場合は、キャッシュ日付=更新日という事になり、下図の日付を超えた場合にはクロール日(+α)という事になります。

SEOビジネスブログ
SEOビジネスブログ

WordPressの使い方
Wordpressの使い方

ただ上記2つのブログに関してはテーマやウィジェットを変更した最終日時を憶えていないので、今表示されている日付が古いものだとしたら、超える可能性はありますね。(追記:その3で検証やり直し

ヤフーは何故『更新日時』と明記しないのか

更新日時であると仮定した場合、なぜヤフーはクロール日表示の説明にそう明記しないのでしょうか?

Yahoo!検索は、なぜ、「 日付の意味 」 を明記しないのか? ‐ SEOの種

  • 「 検索用ロボットがデータを取得した時点での 」 という意味が、正確にイメージできないユーザーが多数存在する。
  • インデックス更新時などに、データの正確性・整合性が落ちる場合があり、「 最終更新日 」 ではなくなるケースが散見される。(※1) ・・などが挙げられます。

【※1】
日付があまりにも古くなってしまった場合、表示されなくなる仕組みや、ページキャッシュが破棄された場合には、「 日付 」 も表示されなくなるというのは、適切な「 仕様 」 だと思われますが、さほど適切とはいい難い現象として、「 日付が、逆行することがある 」 というものがあります。

ほぼ納得と共に、一定期間更新されないページについてはキャッシュ日付が表示されないという仕様も頷けます。とりあえず9月付けのキャッシュ日付ページは見当たらない事からも3カ月ほどでしょうか。

SEOの種さんの記事は2007年のものですので、現在はクロール日表示の説明に『クローラーがページを巡回した日』と明記されていますが、実際の仕様は以前同様、最終更新日のままといった印象です。

ヤフーからの回答

SEOの種さんが仰る様に『検索用ロボットがデータを取得した時点での、ファイルの最終更新日』という回答がYahooから得られるのか一応問い合わせてみました。

すると超速で回答メールが届きました。多く寄せられる質問のためテンプレ化されているのでしょう。

こちらに表示されている日付は、弊社検索エンジン用ロボットが該当のページを巡回した日付です。

検索エンジン用ロボットは、約2~4週間ごとにインターネット全体を巡回し、データベースを最新の情報に更新しています。しかしながら、ページの更新頻度が低いサイト等は更に時間がかかる場合があります。

2~4週間ごとの巡回という所が実際と乖離しておりテンプレが古いのでは?という疑問が残りますが、ヤフーの公式見解としては、あくまでクロール日ベースということです。

ただ、そうなるとキャッシュ日付が数カ月前のページは、その後一切クロールされていないという事なのでしょうか?あとキャッシュ日付が表示されないページについての説明が付きません。

現時点のキャッシュ日付のまとめ

公式にはキャッシュ日付=クロール日という事ですが、アクセス解析のクローラー訪問日からも分かるとおり明らかに単純にクロール日とは言い切れない状況です。

  • 基本的にはページ最終更新日
  • 一定期間更新しないと日付が表示されなくなる
  • 実際の更新日より後の日付になっているブログは多数あり
  • HTMLサイトとCMSサイトでは扱いが異なる可能性あり
  • 静的ページと動的ページで扱いが異なる可能性もあり
  • 更新日だとしたらなぜクロール日にしないのか

ヤフーが更新日と明記しない理由についてはSEOの種さんの意見で納得できますが、クローラーの巡回日と明記しているにも関わらず実際のクロール日を表示しない理由が見当たりません。

ヤフーのキャッシュ日付について触れている記事があまり無かったのですが、既にソース付の確定記事とかありますか?

結構時間をかけて調べましたが、扱っているサイトが少ないことからもほとんどの方にとって、どっちでも良い話である事は間違い無さそうですね。

キャッシュ日付を意図的に新しくするSEO効果

「毎日ファイルをアップする事により更新頻度が高いサイトである事を検索エンジンに伝えインデックスを早める」というSEO手法がありますが、これはYahooのキャッシュ日付が更新日時である事に目をつけたものなのかもしれません。

当然のように、ほとんど修正されていないファイルを毎日アップしてキャッシュ日時を調整しようがSEO効果はないでしょう。さすがに検索エンジンもここまでバカだとは思えません。

ただ、実際に検証を行っていませんし、何を持ってページの更新と判断しているのかは検索エンジン側にしか分かりません。しかし、毎度の事ながらこんな暇があったら新しいページを追加した方が良い事は明白です。

定期インデックス更新の件でも触れましたが、2008年12月のアルゴリズム更新が大きなものであった場合、このSERPsのキャッシュ日付の取扱いについても変化があった可能性も考えられます。

本日1/19にヤフーで大き目の変動が起きているようですね。ということでこの後、公式アナウンスがあれば先日のインデックス更新消滅説は妄想だったということですね。でもこの間隔はなんだったのだろう。


投稿日

カテゴリー:

, , ,

投稿者:

タグ: