印刷用表示へ切り替え 通常表示へ切り替え 更新履歴を表示 更新履歴を隠す
MovableType Google のボットがブログの検索窓で検索をかけてくる

Google のボットが,ブログの検索窓を使って検索をかけてきている。何か意味があるのだろうか。防止できないのか。

■ ■ ■

Movable Type のログ

Movable Type には独自のブログ内検索機構がある。検索ワードはログに保存されるので,たまにログを見ると参考になる。このサイトで何を探したがっているのかが分かるからである。設定したキーワードでは,適当な記事がヒットしていないかも知れない。しかし,サイトの管理者としては,「何を探したがっているのか」を知るのは有効である。「それならば,次はこんな記事を書いてみるか」という動機づけにもなる。

ブログ検索には,「サイトの管理人にメッセージを送る」という秘密の使い方もあるということである。返信はされないので一方通行だし,もしかすると読まれない可能性もあるのだが。

Googlebot による余計な検索

Googlebot が残していったログ
Googlebot が残していったログ


久しぶりにログを見てみると,ログの増え方がひどくなっているのに気がついた。「66.249.67.213」から何度も検索をかけられている。しかも意味がよく分からない。IPひろばなどでこのIPアドレスを調べてみると,ドメインは googlebot.com であることが分かった。つまり,Google のボットが,ブログの検索窓にキーワードを入力して検索をかけているのである。しかも,検索ワードは「すれ」「起動」「登場」「べき」「かえ」「見え」「lan」「no」「そうだ」「for」「dat」「思わ」「言っ」「のか」となっていて,なにがしたいのかよく分からない。強いて言えば,日本語は2文字であることが特徴にはなっている。

だいたい,Google はこのブログのすべてのページをクロールしているのだから,検索しても,出てくるページは既にクロール済のものに決まっている。このサイトの弱弱サーバに負荷がかかるし,Google も計算機資源と時間を使うだけで何も新しい情報が得られていない。lose-lose の関係を生み出している。

普通のクロールはしてくれていいが,検索窓をつかうのだけはやめて欲しい。防止できないのだろうか。

パスワードファイルを盗もうとする誰か

../../../../etc/passwd
../../../../etc/passwd


これは,別のサイトが残していった検索ワードのログである。Google ではない。「/etc/passwd」はないか? じゃ,「../etc/passwd」は? それでもダメなら「../../../../../../../../etc/passwd」ならどうだ! などと,最大11個の親ディレクトリを入力してきている。はい,残念。

Posted by n at 2008-08-09 01:39 | Edit | Comments (0) | Trackback(0)
Trackbacks

  • 「手違いで複数トラックバックを送ってしまった!」という場合でも気にしないでください (重複分はこちらで勝手に削除させていただきます)
  • タイムアウトエラーは,こちらのサーバの処理能力不足が原因です (詳細は トラックバック送信時のエラー をご覧ください)
  • トラックバックする記事には,この記事へのリンクを含めてください(詳細は 迷惑トラックバック対策 をご覧ください)
Comments
Post a comment
  • 電子メールアドレスは必須ですが,表示されません (気になる場合は「メールアドレスのような」文字列でもOKです)
  • URL を入力した場合はリンクが張られます
  • コメント欄内ではタグは使えません
  • コメント欄内に URL を記入した場合は自動的にリンクに変換されます
  • コメント欄内の改行はそのまま改行となります
  • 「Confirmation Code」に表示されている数字を入力してください (迷惑コメント対策です)


(必須, 表示されます)


(必須, 表示されません)


(任意, リンクされます)


Confirmation Code (必須)


Remember info (R)?