分布式数据库系统常见的故障主要有事务故障、系统故障、介质故障、网络引起的故障。
- 事务故障:计算溢出、完整性破坏、操作员干预、输入输出报错等。
- 介质故障:存放数据的介质发生的故障,比如磁盘、磁盘的损坏等等。
- 系统故障:CPU出错、死循环、缓冲区满了、系统崩溃等等。
- 网络故障主要有站点故障、通信故障。
- 站点故障:把网络上各站点可能出现的故障叫做站点故障。
- 通信故障:站点之间通信之间出现的问题称为通信故障。通信故障又可以划分为报文故障、网络分割故障。
- 报文故障:收到的报文格式或数据错误、报文先后次序不正确、丢失了部分报文、长时间收不到报文。
- 网络分割故障:系统中一部分的节点和另外一部分节点完全失去了联系,两组节点无法正常通信。
处理网络分割故障比处理站点故障和报文故障要困难很多,但其发生频率也比站点故障和报文故障低一些。按照故障处理难度升序排列:
- 仅发生站点故障
- 站点故障与报文故障同时存在
- 站点故障、报文故障和网络分割同时存在。