河南财经学院 Henan University of Fit nance an Id Economics 分布式数据库系统及其应用 崔明义 (mycu369@126cm) 计算机应用技术2007级研究生
崔明义 (mycui369@126.com) 计算机应用技术2007级研究生
(第3章分布式数据库中的查询处理和优化 1.分布式查询优化概述 2.分布式查询优化基础知识 3.分布式查询分类和层次结构 4.基于关糸代数等价安换的查询优化处理 5.基于半连接算法的查询优化处理 6.基于直接连接算法的查询优化处理 7.直接连接振作的常用簟略
1. 分布式查询优化概述 2. 分布式查询优化基础知识 3. 分布式查询分类和层次结构 4. 基于关系代数等价变换的查询优化处理 5. 基于半连接算法的查询优化处理 6. 基于直接连接算法的查询优化处理 7. 直接连接操作的常用策略 第3章分布式数据库中的查询处理和优化
1分布式查询优化概述 11分布式查询优化的目标 查询处理问题 集中式 查询转换为代数表达式 从所有等价表达式中选择最优的代数表达式 分布式 除了集中式问题外,还有 站点之间交换数据的操作 选择最优的执行站点(分布) 数据被传送的方式
查询处理问题 • 集中式 – 查询转换为代数表达式 – 从所有等价表达式中选择最优的代数表达式 • 分布式 – 除了集中式问题外,还有 – 站点之间交换数据的操作 – 选择最优的执行站点(分布) – 数据被传送的方式 1.1 分布式查询优化的目标 1 分布式查询优化概述
1分布式查询优化概述 11分布式查询优化的目标 CPU代价(相对固定) 集中式 I/O代价(可变的,优化的目标) 总代价最小 CPU代价 I/O代价(访问磁盘) 目标 主要标准分布式 辅助标准 通讯代价 响应时间最短数据的分布和冗余增加了查询的并行处理 的可能性,从而可以缩减查询处理的响应 时间
1.1 分布式查询优化的目标 1 分布式查询优化概述 目标 总代价最小 响应时间最短 集中式 分布式 CPU代价(相对固定) I/O代价(可变的,优化的目标) CPU代价 I/O代价(访问磁盘) 通讯代价 数据的分布和冗余增加了查询的并行处理 的可能性,从而可以缩减查询处理的响应 时间 主要标准 辅助标准
1分布式查询优化概述 2分布式查询优化准则和代价分析 准则: 使得通讯费用最低和响应时间最短,即以最小的总代价,在最短的响应 时间内获得需要的数据。 1.通讯费用与所传输的数据量和通信次数有关 2.响应时间和通信时间有关,也与局部处理时间有关 查询代价分析 1.远程通讯网络 局部处理时间可以忽略不计,减少通讯代价是主要目标 2.高速局域网 传输时间比局部处理时间要短很多,以响应时间作为优化目标,局部处理 时间是关键
1.2 分布式查询优化准则和代价分析 1 分布式查询优化概述 准则: 使得通讯费用最低和响应时间最短,即以最小的总代价,在最短的响应 时间内获得需要的数据。 1. 通讯费用与所传输的数据量和通信次数有关 2. 响应时间和通信时间有关,也与局部处理时间有关 查询代价分析 1. 远程通讯网络 局部处理时间可以忽略不计,减少通讯代价是主要目标 2. 高速局域网 传输时间比局部处理时间要短很多,以响应时间作为优化目标,局部处理 时间是关键