2分布式数据库系统的故障原因和容错技术 22基本容错方法和技术 进程对( Process pairs) 通过软件模块的双工来实现容错。两个进程,一个是 主进程,一个是备份,它们同时提供同样的服务,主 进程与备份进程都是基于故障-停止模块实现。 分类方式(根据主进程和备份进程之间的通信方式) 锁定-步进方式 自动检查点设置方式 状态检查点设置方式 Delta检查点设置方式 持久进程对
• 进程对(Process pairs) – 通过软件模块的双工来实现容错。两个进程,一个是 主进程,一个是备份,它们同时提供同样的服务,主 进程与备份进程都是基于故障-停止模块实现。 – 分类方式(根据主进程和备份进程之间的通信方式) • 锁定-步进方式 • 自动检查点设置方式 • 状态检查点设置方式 • Delta检查点设置方式 • 持久进程对 2.2 基本容错方法和技术 2 分布式数据库系统的故障原因和容错技术
3分布式数据库的可靠性协议 31分布式数据库系统故障 事务故障 系统故障站点故障 介质故障 通信故障
• 事务故障 • 系统故障 • 介质故障 • 通信故障 3.1 分布式数据库系统故障 3 分布式数据库的可靠性协议 站点故障
3分布式数据库的可靠性协议 32局部可靠性协议 局部恢复管理器(LRM) 每个站点一个 维护局部事务的原子性和持久性 体系结构 数据库存储在稳定存储器中 存储和访问稳定数据库的单位是页面 缓冲区中的数据库称作易失数据库 LRM仅仅在易失数据库上执行事务操作 对数据库的访问都要经由数据库缓冲区管理器 Flush(冲洗)实现将数据库缓冲区页对稳定DB的强 迫写
• 局部恢复管理器 (LRM) – 每个站点一个 – 维护局部事务的原子性和持久性 • 体系结构 – 数据库存储在稳定存储器中 – 存储和访问稳定数据库的单位是页面 – 缓冲区中的数据库称作易失数据库 – LRM仅仅在易失数据库上执行事务操作 – 对数据库的访问都要经由数据库缓冲区管理器 – Flush(冲洗) 实现将数据库缓冲区页对稳定DB的强 迫写 3.2 局部可靠性协议 3 分布式数据库的可靠性协议
3分布式数据库的可靠性协议 32局部可靠性协议 LRM与缓冲区管 理器的接口 主存 局部恢复 管理器 取出, 冲洗 稳定读写 数据库缓冲区读写缓神区 DB 管理器 (易变数据库
数据库 缓冲区 (易变数据库) 局部恢复 管理器 数据库缓冲区 管理器 主存 取出, 冲洗 稳定 读/写 DB 读/写 LRM与缓冲区管 理器的接口 3.2 局部可靠性协议 3 分布式数据库的可靠性协议
3分布式数据库的可靠性协议 32局部可靠性协议 恢复信息 旧的稳定 DB状态 Rcb)「新的稳定 DB状态 Log Undo 数据库Log Redo 新的稳定 DB状态 Unde 旧的稳定 DB状态 数据库Log
• 恢复信息 – Log – Undo – Redo 旧的稳定 DB状态 新的稳定 DB状态 Redo 数据库Log 新的稳定 DB状态 旧的稳定 DB状态 Undo 数据库Log 3.2 局部可靠性协议 3 分布式数据库的可靠性协议