« 注目のapollo、3月末にもベータ公開 | メイン | AdWordsの品質スコアを左右する新要素 »

Googleはいつまで404ページをクロールし続けるのか

うっかりおかしなページへリンクを貼ってしまい、スパイダーがアクセスし続ける。あわててページを削除、或いはエラーを返すようにしたものの、相変わらずクロールされ続けてエラーログが溜まる一方...
そんな経験をしている方は、一体いつになったらロボットは「ここにはアクセスして欲しくない」ということを理解してくれるのだろう?と考えたりしないでしょうか。
WebmasterWorldでその議論がされていましたが、結論から言うと「ずっと来続ける」ということのようです。

How long does Google request 404 page?

逆にクローラーが「ここは404だ」と学習して来るのを止めてしまうと、そのページが復活しても「ここには無い」という情報が残ってしまうのが問題じゃないかという見解ですが...その時はまた、復活するであろう被リンクを辿って来てくれれば良い話な気もします。
スレッドでは既に2年も前に削除したページにアクセスし続けられている人の話もありますが...
どうしても止めたい場合は、robots.txtを使うのが正解のようです。

Social Flares:

add to はてなブックマーク add to ECナビ add to livedoorクリップ add to Newsing add to Nifty Clip add to del.icio.us add to digg! add to FC2 add to Pookmark add to Furl add to technorati add to Ma.gnolia add to Google Bookmark add to Yahoo! my web add to reddit add to PingKing add to ROOTACE add to simpy add to spurl add to BuddyMarks

トラックバック

このエントリーのトラックバックURL:
http://dendrocacalia.com/mt/mt-tb.cgi/103

コメント

About

2007年03月09日 23:33に投稿されたエントリーのページです。

ひとつ前の投稿は「注目のapollo、3月末にもベータ公開」です。

次の投稿は「AdWordsの品質スコアを左右する新要素」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

他のサイト

アーカイブ

あわせて読みたい

あわせて読みたい

なかのひと