DB1とDB2がほぼ同時に停止した経緯(ANAの資料から)

抽出処理を直列化で再発防止

 今回はエイブルのA系のDB1で予期せぬエラーが発生してフリーズ後、同期しているDB2が高負荷状態になり、両DBサーバーを監視プログラムが2台をほぼ同時に停止させたという。

予約管理支援システムのデータ抽出方法を従来の並列処理から直列に改修(ANAの資料から)

 再発防止策として、予約管理支援システムで使うデータの抽出方法を見直し、これまでの複数のクエリ(実行命令)を同時並行で処理する「並列処理」を、1つずつ処理する「直列処理」に変更。直列にすると作業時間は長くなるが、利用者への案内やオペレーションへの影響はないという。

 2台のDBサーバーを監視するプログラムを見直し、2台同時に停止しないよう監視設定を変更した。

 今回のシステム障害で、4月3日と4日の2日間で国内線55便が欠航、遅延が155便発生し、約2万6700人に影響が及んだ。ANAの利用者だけでなく、同じシステムを使うエア・ドゥ(ADO/HD)、ソラシドエア(SNJ/6J)、スターフライヤー(SFJ/7G、9206)、アイベックスエアラインズ(IBEX、IBX/FW)、オリエンタルエアブリッジ(ORC、NGK)の5社にも波及した。

=これまでのシステム障害=
1回目 2003年3月 欠航150便 約10万人に影響
2回目 2007年5月 欠航130便 約9.1万人に影響
3回目 2008年9月 欠航64便 約7万人に影響
4回目 2016年3月 欠航184便 約12.5万人に影響
5回目 2023年4月 欠航55便 約2万6700人に影響
*影響者数は欠航と遅延を合わせた総数

関連リンク
全日本空輸

4月3日発生
・ANAの国内線システム障害、DBサーバーが2台同時停止 2.6万人影響(23年4月4日)
・ANA、システム不具合で手続き一時不可に 国内線欠航22便、2900人影響(23年4月3日)

羽田の大型案内廃止・アプリ強化
・ANA、羽田保安検査場の大型案内板終了 12年強で幕(23年2月9日)
・ANA、羽田保安検査場の大型案内板2/9で撤去 アプリに集約(23年1月30日)
・ANA、国内線自動チェックイン機廃止へ スマホアプリ強化で新サービス(22年5月24日)


21年6月の予約サイト障害
・ANA予約サイト障害、国際線も復旧 通常通り(21年6月14日)
・ANA予約サイト障害、国内線は復旧(21年6月13日)
・ANA、予約サイト不具合続く 12日期限の航空券は延長(21年6月13日)
・ANA、予約サイトに不具合 確認や購入・払戻できず(21年6月12日)

16年3月のシステム障害
・ANAのシステム障害、イーサネットスイッチが故障 篠辺社長ら減給(16年3月30日)
・ANAのシステム障害、完全復旧 7万2000人影響(16年3月23日)
・ANAのシステム障害が復旧 顧客DBの同期トラブル 7万人影響、146便欠航(16年3月22日)

今後はアマデウス導入
・ANA、国内線旅客システムもアマデウスに 自社開発「エイブル」から、25-26年度めど(23年2月14日)