大切なことは全てシステム障害が教えてくれる
新卒でシステムエンジニアになったフレッシュマンに贈る記事です。
システムエンジニアとして大切なことは、全てシステム障害が教えてくれます。障害対応頑張りましょう!
- 主に金融系システムのインフラを担当した
- この春に中小SIerから転職した
- 転職先でもシステム障害に追われていて、障害からは逃れられない運命
私は新卒から約8年勤めた中小SIerを退職し、24年春に転職をしました。
初めての転職で、人間関係だったり、システムへの理解だったり、業務の進め方だったり、色々変わるんだろうなぁと覚悟していたのですが、意外とすんなりと実業務に入っていくことができて、自分でもびっくりしています。
それもこれも全部障害が重なって、あれこれ見聞きする機会に恵まれたおかげです。運がいいのか悪いのか・・・。
キャリアを振り返ってみると、様々な(嫌な)思い出が溢れてきます。転職先でも早速よくわからない障害に相次いで見舞われているので、これはもう逃れられない運命なのだと受け入れることにしました。
不思議なもので、技術者として成長したのはいつもシステム障害と向き合ったときなんですよね。
大変な思いをした障害ほどシステムの仕様を理解するチャンスはありません。偶発的なものや人為的なもの(自分のミス)、大小様々な障害がありますが、いずれも脳裏に刻まれ、類似事象の再発防止のために目を光らせ、技術者として成長する貴重な機会です。
新卒入社から約半年。そのときは訪れました。
早朝にシステム障害を知らせるメールが社用スマホに届いており、指導員がずっとリモートで対応しているのですが、状況が改善せず、対応に苦慮している様子が見られました。新人ながらに「なにかしなくては!」と早めに出社しました。
出社すると次々に周りから偉い人が(たいてい朝早くいるのは偉い人)集まってきて、「いつから障害起きてるの?」「今どういう状態?」「構成図はどれ?」「ログ見た?」「そんなこともわからないの?」等、新人だろうと容赦なく言葉が飛んできました。
「すみません、わかりません。」「確認中です。」など、何度回答したことかわかりません。
当時の私は、どんな機器なのか、どうやって操作するのか、どうやってログをみるのか、なにをすれば通信が復旧するのか、全くわかっていませんでした。(後でわかったのですが、不幸なことに太古の機器だったため、指導員もよくわかっていませんでした)
対応が落ち着いた頃、自分が担当している範囲の機器への操作方法や、監視設定、構成図を念入りに確認し、わからないことはベンダーに確認したり、マニュアルを手に入れて、詳しい仕様まで理解することに努めました。
全く何もわからない、自分が役に立っていない無力感に襲われたからこそ、「次はちゃんとしなくては!」という思いで取り組めたのだと思います。(真面目だね。今では考えられない)
障害は必ず起きるもので、スピーディかつ正確な対応が求められます。システムへの理解が不可欠で、障害に備えれば備えるほど、システムを理解することになるのです。全て障害のおかげです。
新卒配属された部署で金融システムのネットワークを担当することになり、最初に教え込まれたのが、障害が起きたらアプリ担当や関連部署の偉い人に連絡することでした。「人がわからなくても、ヤバそうな障害があったら走り回って大騒ぎしろ」と言われました。
障害があったとき、どのような影響が出ているか分かりづらいことが多々あります。
ネットワーク担当視点では、アプリ担当にサービス影響を確認してもらう必要があります。アプリ担当はアプリ担当で、障害が起きたら影響を確認して関係者に周知することになっていますし、営業担当はアプリ担当の確認結果を受けてお客様向けへのリリースを出すかを判断します。
だから、障害にはみんな興味津々で、一斉に集まってくるのです。集めなくてはいけないのです。
対応を協議する中で、担当者の部署や担当システムを覚えていきます。とても協力的で穏やかなAさん、よくわかってなさそうなBさん、早く復旧しろとキレ散らかすCさんなど様々出会います。障害はパーソナリティも明らかにしてくれます。
その後の普段の業務で連絡するとき、話を聞いて協力してくれそうなAさんに連絡を取る。「お互いに大変ですね・・・頑張りましょ・・・」なんて慰めあう日常はあるあるです。
他部署の人たちと話す機会は障害が与えてくれます。協力関係になれるよう、がんばりましょう!
日常の作業でもそうですが、障害のときにはいつも以上に上司やチームメンバーといろいろ相談します。みんなで対応策を検討し、関係者に説明して、解決に向けて一丸となって進んでいきます。
システムに造詣が深いチームメンバーは、予め持っているドキュメントを見せて、口頭で説明して「あーなるほどねー」とあれこれ理解しますが、第三者にとって仕様書やなんとか管理表なんていうのは意味不明なドキュメントです。
必要なのは、とりあえず読めば状況がわかる資料です。障害の噂を聞いて遅れて参戦した相手にも状況が伝わるよう、過剰すぎず不足すぎず、長すぎず短すぎず、しかもスピーディに作る必要があります。1時間後には関係者に説明しなきゃ!という状況がしばしばあります。
自分のせいでやらかした障害では特に大変で、ポンコツの私は嫌でも大量の資料を作り、そのやらかしを色んな人に説明してきました。復旧に向けての対応をしたいのに、あれやこれや余計な説明に時間を要してしまい、「まだ終わってないの?」なんて聞かれた日にはもう・・・。
でも、悪いのは相手に伝わらない資料を作ってしまった自分です。
わかりやすい資料を作ることで、理解してもらうための説明労力は少なくて済みます。私の場合、いつもいつも担当している作業でやらかしてきたので、指摘事項を微修正しながら資料を作りまくってきました。繰り返し同じ図を見せられ、皆が見慣れたおかげなのか、他部署や偉い人の理解も進んでいきましたね。障害のおかげですね。
さて、障害を経験すると成長するのは間違いないのですが、ストレスも溜まります。それは間違いありません。入社早々に障害に巻き込まれたら、わけもわからず怖いし、いつ帰れるかわからないし、話についていけなくて孤独に感じることも多々あるでしょう。
でも、新人のときの障害というのはすごくお得です。
なぜなら、責任を負わなくていいから!
ただの傍観者でいられるチャンスです。超お得じゃないですか?
「新人」という免罪符は最強です。大抵のことは許してもらえます。障害中に堂々と「すみません、わかりません。」と言って許されるボーナスタイムなのです。
初めて経験する障害は、できることなんて何もありません。良くて書記。ホワイトボードにメモを書くぐらい。とにかく周りを観察しておきましょう。空気感を味わっておきましょう。きっと今後の役に立ちます。
がんばりましょう!がんばりましょう・・・ヒグッヒグッ