ハードウェア障害って起きるのか?

By 神居 - Posted: 2008/10/03 Last updated: 2010/06/26 - One Comment

普通に使ってる分にはPCだってそうそう壊れることはない。メインフレームならなおさらでしょう。そうでなくってもハードウェアに関しては群を抜く絶対の信頼性を売りにしてるわけですし。私も20年以上やってきた中で、ハードウェア障害を目の当たりにしたことはありません。(ソフトウェア障害なら年がら年中でしたけど)障害とはちょっと違うがDASDを熱で止めてしまったことはあります。休日の夜中だったと思うけど1人でデバッグしてたら、突然ホストの反応がなくなった。あれって思ってマシン室に行ったら、いや暑いこと暑いこと。マシン室の空調入れ忘れてました。DASDの筐体だけが妙に熱いので、ケースのカバーを全部開けたらHEATの警告ランプがしっかり点いてました。冷房全開にして、祈りました。2時間か3時間して完全に熱が冷めた後に改めてIPLしたら何事もなく起ちあがりデータも無事でしたが、あの時はさすがにやばいってマジで思いました。
運用担当の人達や、多くのユーザーを担当するメーカーのSEさんならハードウェア障害に遭遇すること、大なり小なりあるんでしょうねぇ。

Posted in つぶやき・雑感 • • Top Of Page

One Response to “ハードウェア障害って起きるのか?”

Comment from YK
Time 2012年4月1日 at 12:30

CPUの障害経験あります。3090でした。
コンソールで仕事してたら
通常は$HASPとかがテレテレ出てくるだけだったのが
見慣れないメッセージがどかどかでてきてスローダウン(でも動き続けてた)
5分もしないうちにコンソール脇の黒電話(古い!)が鳴って出たら
IBMのCEからで
そっちのCPUでECCエラーが出たのでモジュール交換に行きますとの事
サービスプロセッサーが異常を検知しIBM技術所にアラートが飛んだようです。
リモートサポート機能って役に立つんだなーと思いました。
こっちがメッセージマニュアル開く前にけりが付いてしまいましたとさ。