当前位置：和泉文库 > 计算机 > 浏览文档

《并行与分布式程序设计》课程教学参考书：分布式与云计算（美）Tom White《Hadoop权威指南》（中文第3版）

本书从Hadoop的缘起开始，由浅入深，结合理论和实践，全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共16章，3个附录，涉及的主题包括：Haddoop;MapReduce; Hadoop分布式文件系统；Hadoop的I/O、MapReduce应用程序开发；MapReduce的工作机制；MapReduce的类型和格式；MapReduce的特性；如何构建Hadoop集群，如何管理Hadoop;Pig:HBase;Hive;ZooKeeper;开源工具Sqoop,最后还提供了丰富的案例分析。

文件格式：PDF，文件大小：138MB，售价：46.26元

文档详细内容（约691页）

例增多了，碰到问题时，可以向大量活跃的邮件列表发邮件求助。对新手而言，最大的障碍是理解Hadoop有哪些能耐，它擅长什么，它如何使用。这些问题使我萌发了写作本书的动机。 Apache Hadoop社区的发展来之不易。在过去的三年多时间里，Hadoop项目开花结果并孵化出大约半打子项目。到目前，它在性能、可靠性、可扩展性和可管理性方面都实现了巨大的飞跃。但是，为了让更多人采用 Hadoop,我认为我们要让Hadoop更好用。这需要创建更多新的工具，集成更多的系统，创建新的、改进的API。我希望我自己能够参与，同时也希望本书能够鼓励并吸引其他人也参与Hadoop项目。说明在文中讨论特定的Java类时，我常常会忽略包的名称以免啰嗦杂乱。如果想知道一个类在哪个包内，要想查阅相关子项目的Hadoop Java API文档，可以访问Apache Hadoop主页(http:/hadoop.Apache.org)。如果使用IDE编程，可以充分利用其自动补全机制（也称“自动完成机制”）。与此类似，尽管偏离传统的编码规范，但如果要导入同一个包的多个类，程序可以使用星号通配符来节省空间（例如import org.apache.hadoop.io.*)。本书中的示例代码可以从本书网站下载，网址为http:www.hadoopbook.com/。可以根据网页上的指示获取本书示例所用的数据集以及运行本书示例的详细说明、更新链接、额外的资源与我的博客。本书特色内容本书是这样组织的。第1章强调为什么需要Hadoop,然后概述项目发展历史。第2章简要介绍MapReduce。第3章深入剖析Hadoop文件系统，特别是HDFS。第4章包含Hadoop的基本I/O操作：数据完整性、压缩、序列化及基于文件的数据结构。接下来的第5章~第8章深入剖析MapReduce。第5章全景呈现了 MapReduce应用开发所涉及的具体步骤。第6章从用户的角度来看如何在 Hadoop中实现MapReduce。第7章主要包含MapReduce编程模型和 MapReduce可以使用的各种数据格式。第8章是MapReduce高级主题，包括排序和数据连接。 X 前言

点击进入文档下载页（PDF格式）

共691页，可试读40页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录