Google のボットが,ブログの検索窓を使って検索をかけてきている。何か意味があるのだろうか。防止できないのか。
Movable Type には独自のブログ内検索機構がある。検索ワードはログに保存されるので,たまにログを見ると参考になる。このサイトで何を探したがっているのかが分かるからである。設定したキーワードでは,適当な記事がヒットしていないかも知れない。しかし,サイトの管理者としては,「何を探したがっているのか」を知るのは有効である。「それならば,次はこんな記事を書いてみるか」という動機づけにもなる。
ブログ検索には,「サイトの管理人にメッセージを送る」という秘密の使い方もあるということである。返信はされないので一方通行だし,もしかすると読まれない可能性もあるのだが。
久しぶりにログを見てみると,ログの増え方がひどくなっているのに気がついた。「66.249.67.213」から何度も検索をかけられている。しかも意味がよく分からない。IPひろばなどでこのIPアドレスを調べてみると,ドメインは googlebot.com であることが分かった。つまり,Google のボットが,ブログの検索窓にキーワードを入力して検索をかけているのである。しかも,検索ワードは「すれ」「起動」「登場」「べき」「かえ」「見え」「lan」「no」「そうだ」「for」「dat」「思わ」「言っ」「のか」となっていて,なにがしたいのかよく分からない。強いて言えば,日本語は2文字であることが特徴にはなっている。
だいたい,Google はこのブログのすべてのページをクロールしているのだから,検索しても,出てくるページは既にクロール済のものに決まっている。このサイトの弱弱サーバに負荷がかかるし,Google も計算機資源と時間を使うだけで何も新しい情報が得られていない。lose-lose の関係を生み出している。
普通のクロールはしてくれていいが,検索窓をつかうのだけはやめて欲しい。防止できないのだろうか。
これは,別のサイトが残していった検索ワードのログである。Google ではない。「/etc/passwd」はないか? じゃ,「../etc/passwd」は? それでもダメなら「../../../../../../../../etc/passwd」ならどうだ! などと,最大11個の親ディレクトリを入力してきている。はい,残念。
Master Archive Index
Total Entry Count: 1957