印刷用表示へ切り替え 通常表示へ切り替え 更新履歴を表示 更新履歴を隠す
Linux Google ロボット対策テスト

Google 検索エンジンのロボットの制御を行う。これでしばらく様子をみることにする。

■ ■ ■

Google にキャッシュされないように、個別ページに meta タグを書く。2月6日に設置すると、それ以降のページが Google の検索でヒットしなくなった。「キャッシュされないがヒットはする」という設定ができれば嬉しいが、これはできないらしい。

キャッシュされないようにするには、<head> ... </head> 内に

<meta name="ROBOTS" content="NOARCHIVE" />

と書けばよい(参考: Google ページの削除)。ちなみに、W3C勧告によれば content 属性の値 "NOARCHIVE" は正しい値ではないらしい。ただし、今後正式になる可能性はある。

--
meta タグもさらに変更するのがよい.詳しくはnlog(n): robots.txt 設置で.

Posted by n at 2004-02-24 23:52 | Edit | Comments (1) | Trackback(0)
Trackbacks

  • 「手違いで複数トラックバックを送ってしまった!」という場合でも気にしないでください (重複分はこちらで勝手に削除させていただきます)
  • タイムアウトエラーは,こちらのサーバの処理能力不足が原因です (詳細は トラックバック送信時のエラー をご覧ください)
  • トラックバックする記事には,この記事へのリンクを含めてください(詳細は 迷惑トラックバック対策 をご覧ください)
Comments

2月7日以降のページがヒットしなくなったのは、Googlebot が来ていなかったからであった。しばらく様子を見ていると、上記の設定により「キャッシュされないがヒットはする」が可能らしいことが分かった。

Posted by: n at March 14, 2004 04:07
Post a comment
  • 電子メールアドレスは必須ですが,表示されません (気になる場合は「メールアドレスのような」文字列でもOKです)
  • URL を入力した場合はリンクが張られます
  • コメント欄内ではタグは使えません
  • コメント欄内に URL を記入した場合は自動的にリンクに変換されます
  • コメント欄内の改行はそのまま改行となります
  • 「Confirmation Code」に表示されている数字を入力してください (迷惑コメント対策です)


(必須, 表示されます)


(必須, 表示されません)


(任意, リンクされます)


Confirmation Code (必須)


Remember info (R)?