太陽フレアに振り回される夜
大規模な太陽フレアが人類の生活に影響を及ぼすというのは有名な話です。人工衛星や電気系統のトラブルが起きて、通信や電力網に障害を及ぼすという話です。
俄に信じがたい話ではあるのですが、ネットワーク機器も太陽活動の影響を受けます。インフラエンジニアの端くれである私も他人事ではないのです。原因不明のトラブルは、もしかしたら宇宙の影響かもしれません。
ベンダー「宇宙線によるパリティエラーです」
詳しく覚えていないのですが、新卒1~2年目にパリティエラーによるネットワーク機器の再起動を経験しました。運用チームから機器が再起動したとコールを受け、保守ベンダーにログを送付、解析してもらいました。障害が発生した際のいつも通りの流れです。
大抵の場合、機器に異常は見つからず、「一時的なパリティエラーです。様子見推奨します」という話に落ち着くのですが、このときはちょっと違いました。
宇宙線によるパリティエラーです。様子見推奨します
え?宇宙???
最初は「ハハッ!御冗談を・・・!」と思ったのですが、ググると情報があるんですね。天下のCisco社がちゃんと掲載しています。
ソフト エラー
ほとんどのパリティ エラーは静電気や磁気関連の環境条件によって発生します。(中略)
これらのイベントはソフト パリティ エラーと呼ばれ、一般的には一時的またはランダムに発生し、通常 1 回発生します。ソフト エラーは、軽微な場合と重大な場合があります。
(中略)
ソフト パリティ エラーが発生した場合、影響を受けるシステムの場所で発生した最近の環境の変化を分析します。ソフト パリティ エラーを引き起こす可能性のある ESD と EMI の一般的原因は次のとおりです。
電源コードおよび電源装置
引用元
配電ユニット
ユニバーサル電源装置
照明装置
発電機
核施設(放射)
太陽フレア(放射)
パリティ エラーのトラブルシューティング ガイド – Cisco
https://www.cisco.com/c/ja_jp/support/docs/switches/catalyst-6500-series-switches/116135-trouble-6500-parity-00.html
実際のところ、そのようなエラーに直面しても、宇宙線の影響なのか確かめる術はありません。機器のログに残るわけではないので、原因不明のパリティエラーとして処理されます。
一般論として宇宙線の影響は受けるし、そういう可能性があるという話をベンダーから説明してもらって、「なるほど~!宇宙ってすげー!」と思いました。
まさか自分の仕事が宇宙からの影響を受けるなんて想像もしていなかったので、当時はかなり驚いた記憶があります。宇宙のせいならしょうがない。どうしようもないです。
想定外の機器再起動発生
そんな出来事から数年が経った頃、「日本でもオーロラが見える!」なんて盛り上がる日がやってきました。日本どころか世界中がオーロラで沸き立っている最中、その障害は発生しました。
原因不明の再起動が発生したため作業を中止します
とあるベンダーのネットワーク網内でメンテナンス作業があると連絡を受けており、接続部分のネットワークの担当として大先輩がリモート立会い中でした。その作業を始めようとしたところ、何も作業をしていないのに、原因不明の再起動が発生したというのです。(記事執筆時点でも原因不明)
最初は「ベンダーがオペレーションミスったんじゃね?」と疑っていたのですが、話を聞いている中でふと頭に浮かんだのは「太陽フレア」という単語。日本でもオーロラが見えるほどの異常事態ですから、これはもう宇宙のせいだろうなと勝手に決めました。
物理学どころか宇宙物理学も詳しくないですが、太陽フレア発生時には宇宙線が飛んでくるということは頭にあり、ログを見てもすぐに原因がわからないなら、それはもう宇宙のせいです。
担当している構成内で、冗長化している機器のActive/Standbyが切り替わっているので、通信影響も出ていました。切り戻しとなるとやはり影響がでます。明け方まで偉い人たちとも緊急会議をしながら、今後の対応方針を決めようとしますが、原因と対処がはっきりするまで身動き取れません。でも何したって無駄だよ、宇宙のせいだから。早く寝かせてくれー。と思いながら会議に参加していました。
なんなら途中で「きっと宇宙線のせいですよ。日本でもオーロラ見れるぐらいの太陽フレアなんで、その影響じゃないですか」なんて言ってみました。降り注いだ中性子線のせいでビット反転したんですよ。たぶんね。ナニイッテンダコイツみたいな反応されました。
「データセンターはそういう対策してるもんじゃないの?」なんて言われました。いや、無理でしょ。貫通するでしょ。
-中性子によるソフトエラーは、どのようにして発生するものなのでしょうか?
岩下氏 中性子は、宇宙線が地球の大気に衝突することで発生します。発生した中性子は、「中性子線」となって地上に降り注ぎます。中性子は非常に高い透過力を持っているため、地上に降り注ぐとビルなどを貫通し、電子機器の半導体デバイス(一般的にはシリコンで構成されている)に到達します。通常、中性子はシリコンを通過しますが、時折、シリコンの原子核と核反応を起こすことがあります。中性子がシリコンの原子核と核反応を起こすと、電荷を帯びた粒子「荷電粒子」が生成されます。
半導体デバイスでは、情報は通常「ビット」として電気的に保存されていますが、荷電粒子によって、保存されたデータが書き換えられてしまうことがあります。このようにして起きるエラー現象は、実際にデバイスが破壊されたわけではなく、単に情報が書き換わっただけなので、ソフトエラーと呼ばれています。
中性子による「半導体ソフトエラー発生率」の全貌解明は、地球上から宇宙まで、すべてのデジタルデバイスを守る鍵となる| 地球の未来を宇宙から考えるメディア Beyond Our Planet
https://www.rd.ntt/se/media/article/0085.html
おやすみ
途中から堂々巡りの会議に飽きてしまい、オーロラのことを調べ始めました。日本各地で撮影されていて、すごいなと思いました(小並感
困るのは予定していたメンテナンス作業は中止になったので、どこかで再作業をすることです。立会い体制考えないといけないし、今後計画している作業のスケジュールも後ろ倒しになるかもしれません。困ったなぁ。
5時ぐらいまで会議して、ちょっと資料を整えて、6時頃スヤァして9時頃に起きました。7時頃にベンダーの担当者さんから電話がかかってきていました。鬼かよ。
さすがに寝ているだろうし、起こすのも悪いと思って、しばらく放置。折り返し連絡したというアリバイ作りで、11時頃に電話して短めのコールを残しておいたら、数分後に折り返し電話がかかってきました。まさか完徹??大手SIerって体力オバケですね。
宇宙はすごいね。宇宙のこと考えだしたら寝れないね。