【東証システム障害】日本取引所、売買停止の原因は「共有ディスクのメモリ故障」

ニュース
1: 2020/10/01(木) 19:53:19.50
■東証の横山CIO「市場参加者と協議し終日売買停止を決定」

東京証券取引所の宮原幸一郎社長は1日、東証で全銘柄の取引が終日停止となったことに関して記者会見に臨んだ。冒頭で「市場参加者と投資家に迷惑をかけたことをおわび申し上げる」と謝罪した。

東証を傘下に抱える日本取引所グループ(8697)の横山隆介・最高情報責任者(CIO)は問題が起きた経緯について「7時4分に運用系の共有ディスク装置1号機のメモリー故障が発生した」と説明。「本来であれば2号機に切り替わるはずだったが正常にできなかった。その結果として、情報配信ゲートウェイ(相場報道のサーバー)の配信処理に異常が発生した」と述べた。

終日売買停止とした理由について「システム再起動を行った場合、投資家や市場参加者に対し混乱を生じることが想定された。内外の市場参加者と協議したところ十分な顧客対応や円滑な売買の実施が難しいとの要請もあり、終日売買停止とすることとした」と説明した。

明日の市場については「再開に向けて本日中にハード交換とシステム再立ち上げを実施する。万が一の故障発生時にも速やかに切り替えできる体制を確立したい」と述べた。

2020/10/1 17:00
https://www.nikkei.com/article/DGXLASFL01HT5_R01C20A0000000/
——–
■東証システム障害の発端は共有ディスク装置のメモリ故障、東京証券取引所 宮原社長らが会見で経緯を説明

https://live2.nicovideo.jp/watch/lv328335496

・10/1(木)7:04に共有ディスク装置1号機のメモリ故障が発生
・1号機故障時に2号機へ切り替わらず、相場情報配信業務や売買監視業務に異常が発生

【画像】報道配布資料
https://pbs.twimg.com/media/EjOjKvCU0AAzfM0.jpg

午後4:39 ・ 2020年10月1日
https://twitter.com/nico_nico_news/status/1311571524113952768

★1が立った時間 2020/10/01(木) 12:44:02.37
前スレ
https://asahi.5ch.net/test/read.cgi/newsplus/1601545635/
https://twitter.com/5chan_nel (5ch newer account)

2: 2020/10/01(木) 19:53:37.75
会見を見始めたが
ストレージ装置のコントローラの冗長構成でメモリ障害での
フェイルオーバー失敗というのは時々聞く話ではある。

14: 2020/10/01(木) 19:55:43.49
>>2
だからなに?
「よくあること」で富士通に経済破壊されたら日本塵は困るんだけどw 

25: 2020/10/01(木) 19:56:59.18
>>14
もちろん重大バグだよ。弁護する気もない。

でもどのストレージベンダでも起こしているバグでもある。

5: 2020/10/01(木) 19:55:01.32
本当の原因を隠してるよね

9: 2020/10/01(木) 19:55:36.40
>>5
誰かがケーブルを踏んだとか?

6: 2020/10/01(木) 19:55:10.96
ハード的な故障は仕方ない。その為の多重構成なわけだし
問題は、何故サブ機に切り替えられなかったのかという事

23: 2020/10/01(木) 19:56:39.37
>>6
dumpが吐き出されなかったので
再現待ちです!(^^)

でしょ多分。

7: 2020/10/01(木) 19:55:31.25
美しい人生よ~♪

8: 2020/10/01(木) 19:55:32.80
原発は絶対安全

10: 2020/10/01(木) 19:55:40.70
サムソン?

11: 2020/10/01(木) 19:55:41.18
時代はクラウドですよ

12: 2020/10/01(木) 19:55:41.56
988不要不急の名無しさん2020/10/01(木) 19:52:36
>>789
今時のストレージは水平パリティと垂直パリティ両方持ってるから
メモリ不良で止まるとは思えない
他の事情だろうが 言えない事情だろうな

13: 2020/10/01(木) 19:55:41.98
再現したときに人力で手動切替するために人が張り付くって言ってるな。

15: 2020/10/01(木) 19:55:59.77
ファーストサーバ

16: 2020/10/01(木) 19:56:05.13
損害賠償とか無かったら、東証は損はしないのか。

18: 2020/10/01(木) 19:56:16.00
ただ、東証はきちんと対応している
そこはすごい評価できる

19: 2020/10/01(木) 19:56:16.20
だからサムスン製のを使っておけとあれほど

20: 2020/10/01(木) 19:56:25.01
IBM 「tpfとparallel sysplexで」
HP「nonstop」
富士通「PCサーバーでいけるwwっw」

22: 2020/10/01(木) 19:56:36.68
オンプレでもフェールオーバーするやろ

26: 2020/10/01(木) 19:57:24.33
お金が消えた投資家と責任とらされる使い捨てソルジャー
全部で何人自殺するかな

27: 2020/10/01(木) 19:57:27.27
節目の時期に?あやしい

28: 2020/10/01(木) 19:57:43.18
蓮舫にクラウドにしろって言われるぞ

29: 2020/10/01(木) 19:57:47.74
深刻な問題は2号機に切り替わらなかったことじゃね?

30: 2020/10/01(木) 19:58:01.75
滅多に起こることじゃないから安全ヨシ!

32: 2020/10/01(木) 19:58:04.26
富士通のシステムで障害時にフェイルオーバー成功した事例ってあるのか?w

33: 2020/10/01(木) 19:58:13.03
は?なんでメモリの故障ぐらいで丸一日復旧できないの?馬鹿なの?

34: 2020/10/01(木) 19:58:17.56
明日は全体的に上がりそう

なんとなくだけど

35: 2020/10/01(木) 19:58:17.69
再起動するとデータ不整合の可能性ってのはトラブル時の復旧シナリオの設計時のハード選択と合わせて考慮すべき復旧シナリオ作成時の取りこぼしによる設計段階のエラーなんじゃないの?
シナリオで動けなかった予想外の停止ということは

54: 2020/10/01(木) 20:00:52.16
>>35
おそらく、停止したディスクにからむところに
トランザクションやスケジュール処理にからむ情報があって
整合性の維持が確信できない状況になったんでは。

36: 2020/10/01(木) 19:58:19.14
過去には NYでもロンドンでも システム障害で売買停止してるし
まあ 終日停止ってとこだな 東証はいいよね 謝ればいいだけでマスコミと同じ
責任は一切とらないし賠償もない お気楽な 賭場の管理者だよwwwww

37: 2020/10/01(木) 19:58:23.54
言われてみれば原発事故と同じだね いざというときのバックアップが機能しない

56: 2020/10/01(木) 20:01:14.47
>>37
失敗から目を背けて想定しないジャップらしさが出てるな

38: 2020/10/01(木) 19:58:25.87
会見
IPアドレス、パスワード、始動スケジュールなどを全部持っているのが共有サーバ
2号機にミラーリングしていないんだろうな。

39: 2020/10/01(木) 19:58:34.54
F社はストレージも中身はOEMだろうから設定とかの説明書もよくわからんのよ

40: 2020/10/01(木) 19:58:36.35
メモリ障害でFlash処理ができずにディスクファイルを壊した?あるあるだけど…

41: 2020/10/01(木) 19:58:37.85
明日には取引できるようになるなんて
快挙ですね
素晴らしい技術力だ

43: 2020/10/01(木) 19:59:05.51
原発事故を隠蔽するから
バックアップが動かなくなる呪いがかかるわけよ

44: 2020/10/01(木) 19:59:27.09
もぉAWSに預けろよ

51: 2020/10/01(木) 20:00:27.98
>>44
AWSもやらかしてるから・・・

60: 2020/10/01(木) 20:01:30.97
>>44
マジでそれがいいと思う。
ソフトウェアエンジニアがひと山いくらで計算される日本企業ではマトモなシステムやインフラを構築できないと思う 

45: 2020/10/01(木) 19:59:36.44
試しに明日はサーバーの電源コードを引っこ抜いてみてよ
今度はバックアップに切り替わるんでしょ?

46: 2020/10/01(木) 19:59:38.32
無能

47: 2020/10/01(木) 19:59:39.65
東芝使えよ!

49: 2020/10/01(木) 20:00:13.07
これが本当のハードラックってか?

50: 2020/10/01(木) 20:00:14.81
若い頃にシス管の道もあったがならなくてよかった
こんなリスキーな職になるとは

52: 2020/10/01(木) 20:00:46.10
(-_-;)y-~
なんかシンプルじゃないシステムって感じがするなぁ。

55: 2020/10/01(木) 20:00:56.77
どうせ共有ディスクのファイルシステムをロッキングしたままのプロセスがいたから、切り離しが出来なかったんだろ?

57: 2020/10/01(木) 20:01:20.43
ドコモTOB対策、なんかの大規模売り防御、そんあ映画みたいなすげええってなる理由がよかった。
なんだよ、メモリー故障って。 RAIDみたいなもっと高度なことやってんじゃねーのかよ。

58: 2020/10/01(木) 20:01:26.82
共有ディスク装置ってスタンドアロンなアプライアンス? それともサーバー機内蔵のドライブをnfsとかで共有してんの?

59: 2020/10/01(木) 20:01:30.33
つまりグーグルなどの大手でとにかく障害復旧などの経験値がたかいほうがリスクをうまく網羅できて安全性が高いってことだね

たしか東証のシステムにはいってるアメリカのニュータニックスは新興企業
画期的な仮想化技術でベンチャー企業から脱皮しつつ有る時に東証が取り入れたみたい

設計する人の経験値が足りなかったのかも

引用元: ・https://asahi.5ch.net/test/read.cgi/newsplus/1601549599/

コメント

タイトルとURLをコピーしました