当前位置：和泉文库 > 计算机 > 浏览文档

《Managing XML and Semistructured Data》教学资源（PPT课件讲稿）Part 04 Compressing XML Data

文件格式：PPT，文件大小：2.24MB，售价：22.76元

文档详细内容（约115页）

Block size Representative datasets and queries a Datasets Heavy text Light text A mix of heavy text and light text eries High Selectivity Medium Selectivity Low selectiv

21 Block Size Representative datasets and queries: ▪ Datasets: • Heavy text • Light text • A mix of heavy text and light text ▪ Queries: • High Selectivity • Medium Selectivity • Low Selectivity

Block size 12.9 13.6 10 Swiss Prot-L- Swiss Prot-M- SwissProt-H XM ark-M-合 XMark-H -OM IM-L +OM IM-M OM IM-H omgc 9876543 小上AA44 100 6001000 10000 Block Size data records)

22 Block Size 0 1 2 3 4 5 6 7 8 9 1 0 1 0 100 1000 10000 Block Size (# data records) Querying Time (sec) SwissProt-L SwissProt-M SwissProt-H XM ark-L XM ark-M XM ark-H OM IM -L OM IM -M OM IM -H 12.9 13.6 600

Structure of Compressed-Data Block size? Determined by an empirical study Querying Time near-optimal range: 600-1000 data items/block (average optimal: 950) Compression ratio Not improved much after 150 KB/block (usually contain more than 1000 items) >1000 data items/block

23 Structure of Compressed-Data ▪ Block size? • Determined by an empirical study • Querying Time ▪ near-optimal range : 600-1000 data items/block (average optimal: 950) • Compression Ratio ▪ Not improved much after 150 KB/block (usually contain more than 1000 items) • ≥ 1000 data items/block

O utline ■ Introduction XQzip eDBT2004 Indexing Data Compression Query evaluation Performance evaluation Conclusion 24

24 Outline ▪ Introduction ▪ XQzip [EDBT 2004] • Indexing • Data Compression • Query Evaluation • Performance Evaluation ▪ Conclusion

XQzip Query Coverage All XPath axes except the sideways axes( e.g preceding following)-siblings Multiple and nested predicates and/or not expressions Aggregations: sum, count, average, max, min Group queries: e.g(L1L2+L3+ L4) LI: /ab=Crete](prefis L2. c L3: d[/count(>100]L4: e/lg

25 XQzip Query Coverage ▪ All XPath axes except the sideways axes (e.g. preceding, following)-siblings ▪ Multiple and nested predicates • and / or / not expressions ▪ Aggregations: sum, count, average, max, min ▪ Group queries: e.g. (L1 (L2 + L3 + L4)) • L1 : //a[b = “Crete”] (prefix) L2 : c • L3 : d[f/count() >100] L4 : e[//g]

点击进入文档下载页（PPT格式）

共115页，可试读30页，点击继续阅读 ↓↓

您可能感兴趣的文档

《JAVA面向对象入门技术》教程教学资源（PPT课件讲稿）第二章 Java语言基础
北京大学：《项目成本管理》课程教学资源（PPT课件讲稿）项目范围计划（主讲：周立新）
山东大学：《网站设计与建设》课程教学资源（PPT课件讲稿）第三部分网站设计技术第20章 MySQL数据库
程序设计工具（PPT课件讲稿）Software Program Tool
《Java Web应用开发技术与案例教程》教学资源（PPT讲稿）第7章 Java Web常用开发模式与案例
《面向对象程序设计》课程教学大纲（适用专业：信息与计算科学）
《编译技术》课程教学资源（PPT课件讲稿）第六章运行时存储空间的组织和管理
沈阳理工大学：《计算机网络》课程教学资源（PPT课件讲稿）第2章 IP技术
香港科技大学：Record Linkage for Big Data
中国科技大学计算机系：《黑客反向工程》课程教学资源（PPT课件讲稿）黑客反向工程导论（陈凯明）
《单片机应用技术》课程PPT教学课件（C语言版）第10章单片机测控接口
《计算机操作系统》课程教学资源（PPT课件讲稿）第四章存储器管理
Introduction to Text Mining 文本挖掘
北京大学：烟花算法的变异算子（PPT讲稿）Mutation Operators of Fireworks Algorithm
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）绪论、第1章量化设计与分析基础（主讲：周学海）
清华大学出版社：《计算机应用基础实例教程》课程教学资源（PPT课件讲稿，第二版，共七章，主编：吴霞，制作：李晓新）
《计算机算法设计与分析》课程教学资源（PPT课件）第8章回溯法
白城师范学院：《数据库系统概论 An Introduction to Database System》课程教学资源（PPT课件讲稿）第二章关系数据库（2.1-2.3）
《操作系统》课程教学资源（PPT课件讲稿）实时调度 Real-Time Scheduling
四川大学：《操作系统 Operating System》课程教学资源（PPT课件讲稿）Chapter 6 Concurrency - Deadlock（死锁）and Starvation（饥饿）
《网络搜索和挖掘关键技术 Web Search and Mining》课程教学资源（PPT讲稿）Lecture 12 Language Models
Progress of Concurrent Objects with Partial Methods
《编译原理与技术》课程教学资源（PPT课件讲稿）代码优化
《单片机应用技术》课程PPT教学课件（C语言版）第3章 MCS-51指令系统及汇编程序设计

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录