朝チェックしてみると,サーバが停止していた。熱暴走だろうか。
このサイトのサーバは ThinkPad T22 Pentium III 1 GHz, メモリ 512 MB で動いている(ThinkPad T22(2647-9EJ) - 製品仕様)。OS は Vine Linux 3.2 kernel-2.4.31 である。
今朝起きてからチェックすると,電源が切れていた。裏側に手を当ててみると冷たい。止まってからかなり時間が経っていることになる。通常は CPU やハードディスクが稼動しているため温かいからだ。実は,昨日も停止していた。
このサイトでは温度監視を行っており,MRTG で記録とグラフ化を行っている(nlog(n): 温度変化を MRTG で表示する)。グラフから何か分かるかも知れない。
昨日は午前2時頃,今日は午前0時30分頃でグラフが途切れている。サーバがダウンしたためである。どちらも温度上昇中に突然ダウンしているのが分かる。
深夜の温度上昇は,大きなジョブが原因である。Movable Type の記事の再構築を夜中に行っているためだ(nlog(n): cron でインデックスを再構築)。
これは1週間分のグラフ。定期的に温度が上昇し下降している。ジョブが起動し,終了していることを意味する。
平均の温度は 52℃ と少し高め。最高は 61℃ となっていた。原因は熱かも知れない。熱でダウンしたとすると,トリガは次の2つのどちらかであると推測できる。
熱暴走して停止する場合,CPU が正常に動作しなくなるだけなので,ハードディスクの電源は切れずにハングアップしていることが多い。今回は電源が切れていることから,設定が疑わしい。BIOS の設定項目をチェックする必要がある。Linux で設定があるかどうかは不明である。
最近は気温が高くなっているのでサーバの温度も高くなる。今回のダウンの原因がどうであれ,サーバの熱対策を何か考えなければならない。ブログのデータが飛んでしまうと痛すぎる。
Master Archive Index
Total Entry Count: 1957