印刷用表示へ切り替え 通常表示へ切り替え 更新履歴を表示 更新履歴を隠す
misc 国立国会図書館の巡回ロボット

ndl-japan-research-robot-1.0 というエージェント名を持つロボットが巡回に来はじめた。国立国会図書館の調査だという。

■ ■ ■

ログには、次のように記録されている。

202.217.35.20 - - [23/Dec/2004:18:54:48 +0900] "GET /archives/000324.html HTTP/1.1" 200 13171 "http://nlogn.ath.cx/archives/cat_misc.html" "ndl-japan-research-robot-1.0 (http://www.ndl.go.jp/jp/aboutus/bulkresearch2004/index.html)(http://e-public.nttdata.co.jp/bulkresearch2004/index.html)"

アクセス元が IP アドレス表示になっている。公式な調査であるなら、FQDN (ホスト名) も割り当てた方がいいのではないだろうか? アクセスは 30 秒に1回なので、サーバに大きな負荷がかかることはない。

国立国会図書館: 「デジタルアーカイブのための日本のウェブサイトの実態調査」のお知らせ

[目的]

 インターネット上に存在する電子情報は、近年、急速に増大しており、また、後世に残すべき「文化財」としての重要性も高まっています。しかし、ウェブ情報は、日々更新されており、歴史的観点から見て貴重な情報が記録されることなく消滅する危険性に直面しています。そこで、国立国会図書館では、将来、これら消え行くウェブ情報を収集・保存し後世に残すことを計画しております。今回は、その実施可能性や方法の検討を行うため、実態調査を実施いたします。

同ページには、このロボットが正しい動作をするということを謳っている。実際の調査は、NTT データが担当しているとある。エージェント名の後ろの方にある、NTT データのサイトにも同じ記述がある。

NTT データ: デジタルアーカイブのための日本のWebサイトの実態調査のお知らせ

2004年12月25日追記:
このクローラ(巡回ロボット)のアクセスは丸1日以上も続いていて、少し邪魔。

Posted by n at 2004-12-23 19:25 | Edit | Comments (0) | Trackback(0)
Trackbacks

  • 「手違いで複数トラックバックを送ってしまった!」という場合でも気にしないでください (重複分はこちらで勝手に削除させていただきます)
  • タイムアウトエラーは,こちらのサーバの処理能力不足が原因です (詳細は トラックバック送信時のエラー をご覧ください)
  • トラックバックする記事には,この記事へのリンクを含めてください(詳細は 迷惑トラックバック対策 をご覧ください)
Comments
Post a comment
  • 電子メールアドレスは必須ですが,表示されません (気になる場合は「メールアドレスのような」文字列でもOKです)
  • URL を入力した場合はリンクが張られます
  • コメント欄内ではタグは使えません
  • コメント欄内に URL を記入した場合は自動的にリンクに変換されます
  • コメント欄内の改行はそのまま改行となります
  • 「Confirmation Code」に表示されている数字を入力してください (迷惑コメント対策です)


(必須, 表示されます)


(必須, 表示されません)


(任意, リンクされます)


Confirmation Code (必須)


Remember info (R)?