「累积分布函数 100% 90% 80% 70% --. Plan 60% Plan 2 ng2 50% 40% E30% 20% 10% 0% 25 30 Execution Cost
累积分布函数
查询代价概率密度函数 的计算方法 信息源 Selectivity的概率密度函数:f(s) 口针对特定 Selectivity的计算代价c=g(s) ■计算公式 f(c)=ig"(c)
查询代价概率密度函数 的计算方法 ◼ 信息源 ❑ Selectivity的概率密度函数:f(s) ❑ 针对特定Selectivity的计算代价:c=g(s) ◼ 计算公式 f (c) f(g (c)) * -1 =
SAMPLE的方法 随机 SAMPLE的优点 口不受AⅥ的影响 不受“ Curse of dimensionality"的影响 口不受 Equality和 Range谓词的限制 口易于操作 两步工作 口预计算 通过 Update Statistics命令执行 a估测 在查询优化的过程中执行
SAMPLE的方法 ◼ 随机SAMPLE的优点 ❑ 不受AVI的影响 ❑ 不受“Curse of dimensionality”的影响 ❑ 不受Equality和range谓词的限制 ❑ 易于操作 ◼ 两步工作 ❑ 预计算 ◼ 通过Update Statistics命令执行 ❑ 估测 ◼ 在查询优化的过程中执行
预计算阶段 1. Construct a uniform random sample of R using any of the known methods for sampling from databases [26] 2. For every relation S such that R has a foreign key to S, join the sample of R with the full relation S 3. Repeat Step 2 recursively, i.e., for each relation S from Step 2 follow all its foreign keys. and so on
预计算阶段
Joins Inventory Prices 40 HP 999 Asus 20 IBM 2100 IBM 60 AsUs 1500 Dell 30 Dell 1300 SELECT* FROM INVENTORY inV, PRICE p WHERE invcount >=30 AND p price 1400 AND inv model =p model
Joins Prices HP 999 IBM 2100 Asus 1500 Dell 1300 SELECT * FROM INVENTORY inv, PRICE p WHERE inv.count >= 30 AND p.price < 1400 AND inv.model = p.model Inventory HP 40 Asus 20 IBM 60 Dell 30