さて、SRECon (や、USENIX LISA)では、ここしばらくCore Principles トラックという形で、 SREのチームの作り方やSREチームの運営のしかた…等といった話を多数聞くことができるわけですが、 前に書いた記事で少し触れたように、 SRECon19EMEAの特徴だった、 運用まわりで使える確立した方法論の話をもう一回振り返ってみます。
まえおき
この記事はあと3回更新します。
- まずはポインタの一覧だけ(DONE)
- それぞれ解説(みたいなの)を追加
- SRECon の本筋の Core Princilple の話を追加
- 日本発のback to basicな話の事例ということでTPSの話(これは別記事にするかも)
運用まわりで使える back to basic な方法論
とりあえず、私が現地で聞いたセッションの中で気づいたものの一覧だけ。
-
Systems Theory -システム理論
- wikipedia(ja)
- SRECon19EMEA セッション
- Speaker : Prof. Leveson, MIT
-
Control Theory - 制御理論
- wikipedia(ja)
- SRECon19EMEA セッション
- Speaker : Ted Hahn, TCB Technologies, and Mark Hahn, Ciber Global
-
Incident Command System - 現場指揮システム
- wikipedia(ja)
- SRECon19EMEA セッション
- Speaker : Alex Hidalgo and Alex Lee, Squarespace
-
Fault Tree Analysis - 故障木解析
- wikipedia(ja)
- SRECon19EMEA セッション
- Speaker : Andrey Falko, Lyft
-
Formal Verification Method - 形式的検証手法
- wikipedia(ja)
- SRECon19EMEA セッション
- Speaker : Heidy Khlaaf, Adelard LLP
SRE Core Principles
TBD
TPS : Toyota Production System - トヨタ生産方式
まずはとりあえず、関連情報のリンクだけ。