MySQL女子のとほほい日記

WEB業界の濃ゆいシステムのところで働いているIT女子の日記です。理想は酸いも甘いも噛み分けたいけど、トホホいな話を綴ります。

■先日のクレジットカードシステム障害が気になる件

先週発生したクレジットカードシステムの障害が

Yahooニュースになっていたので、その後が気になって調べてみた。

 

ECサイトを作ってると、一度は聞いたことがある「CAFIS(きゃふぃす)」という

クレジットカード情報のチェックをするシステムに障害があり

 

原因は

ハードウエア不安定 による ミドルウェア制御負荷

とのことですが、

 

 

ふつう、このような

お金を扱うやばいシステム

は絶対、1つが落ちても大丈夫なように多重化されています。

 

 

しかも、障害発生しても人手を介さず、

自動で切り替える仕組みになっている

ので

 

ニュース - [続報]CAFIS障害はFEPサーバーのダウンが原因、3割のクレカ決済に影響:ITpro

にあった

 

SEが状況を把握、判断した上で待機系のサーバーに切り替えて復旧させたという。

 

ん?人が切り替えた? そんな仕組みでいいのか!?

んなわけねーだろ!!??

 

そうせざるを得ない状況に陥った

というのが本当のところだと思います。

 

サービスインフォメーション詳細 | CAFIS 総合

の最終報には

 

故障発生原因と思われるサーバのハード交換を実施

 

となり、

 

ハードウエアが壊れちゃったのはしょうがないもんね。

 

という逃げ感プンプンなスメルがしますが

 ↑ 1~2時間とはいえ日本最大級のクレカ決済障害の機会損失(¥)を考えるとそう言い切りたい気持ちもわかる。

 

切り替えできなかった原因にについては報告されていませんので

 

フェイルオーバのテストしてなかった

か、

テストケースに入ってなかった(想定外?)

か、

 

いずれにしても、

 

どこかのSEが猛省していると思われます

 

やっぱり、ここぞ!というときに切り替わってもらわないと!

 

保険とHAはやっててよかった!やってて安心!   が基本ですが

常日頃から、状況の変化によって見直し&検証も必要かー。

 

商用のクラスタソフトといえども、信用おけないし。

去年メーカーの不具合(バグ)に巻き込まれ荒波もまれたことがあるので

(トレースで不具合箇所の指摘するまで再現しないの一点張り)

何が起きるかわからないとき のためにHAがあるんだけど

そのHA自体、何がおきるかわからない。