フォールトトレランス(ふぉるととれらんす)
最終更新:2026/4/25
フォールトトレランスは、システムの一部に故障が発生しても、システム全体としての機能を維持できる能力のことである。
別名・同義語 耐故障性故障許容性
ポイント
フォールトトレランスは、システムの信頼性向上に不可欠な概念であり、冗長化やエラー検出・訂正などの技術によって実現される。
概要
フォールトトレランス(Fault Tolerance)とは、システムやコンポーネントに故障(フォールト)が発生した場合でも、システム全体としての機能や性能を維持し続ける能力を指します。これは、特にミッションクリティカルなシステム、つまり、システムの停止や誤動作が重大な結果をもたらす可能性のあるシステムにおいて重要な特性となります。
実現方法
フォールトトレランスを実現するためには、様々な技術が用いられます。主なものとしては以下が挙げられます。
- 冗長化 (Redundancy): 同じ機能を持つコンポーネントを複数用意し、いずれか一つが故障しても、他のコンポーネントがその機能を代替できるようにします。ハードウェア冗長化、ソフトウェア冗長化などがあります。
- エラー検出・訂正 (Error Detection and Correction): データ伝送や保存中に発生するエラーを検出し、自動的に訂正する技術です。チェックサム、パリティチェック、ECC (Error Correcting Code) などが用いられます。
- フェイルオーバー (Failover): 故障が発生した場合に、自動的に予備のシステムやコンポーネントに切り替える機能です。
- 自己診断 (Self-Diagnosis): システム自身が自身の状態を監視し、故障を早期に発見する機能です。
- 多様性 (Diversity): 同じ機能を実現するために、異なる設計や実装方法を用いることで、共通の故障原因によるシステム全体の停止を防ぎます。
適用分野
フォールトトレランスは、以下のような様々な分野で適用されています。
- 航空宇宙: 航空機の制御システム、宇宙船の運用システムなど
- 金融: 銀行の取引システム、クレジットカード決済システムなど
- 医療: 生命維持装置、医療診断システムなど
- 通信: 通信ネットワーク、データセンターなど
- 産業制御: 工場の自動化システム、発電所の制御システムなど
注意点
フォールトトレランスを実現するためには、コストや複雑性が増加する場合があります。そのため、システムの重要度や要求される信頼性レベルに応じて、適切なレベルのフォールトトレランスを設計する必要があります。