当前位置：和泉文库 > 计算机 > 浏览文档

厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第8章 Hadoop架构再探讨

• 8.1 Hadoop的优化与发展 • 8.2 HDFS2.0的新特性 • 8.3 新一代资源管理调度框架YARN • 8.4 Hadoop生态系统中具有代表性的功能组件

文件格式：PPT，文件大小：4.9MB，售价：12.11元

文档详细内容（约51页）

g 8.2.1HDFS HA hdS HA( High Availabilit!y)是为了解决单点故障问题屮HA集群设置两个名称节点,“活跃( Active)”和“待命( Standby)” 两种名称节点的状态同步,可以借助于一个共享存储系统来实现一旦活跃名称节点出现故障,就可以立即切换到待命名称节点啁 Zookeeper确保一个名称节点在对外服务 ·名称节点维护映射信息,数据节点同时向两个名称节点汇报信息 Zookeeper Zookeeper…( Zookeeper 心跳障恢复控制器敌障恢复控制器 (活跃) (待命) 监控名称节点命令命令监控名称节点健康状态健康状态名称节点共享存储系统名称节点 (活跃)(NFS、QJM或 Zookeeper(待命) 向名称节点汇报自己保存的块信息向名称节点汇报自己保存的块信息数据数据数据节点节点节点图 HDES HA架构大数据技术原理与应用(第3版) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 8.2.1HDFS HA 图 HDFS HA架构 •HDFS HA（High Availability）是为了解决单点故障问题 •HA集群设置两个名称节点，“活跃（Active）”和“待命（Standby）” •两种名称节点的状态同步，可以借助于一个共享存储系统来实现 •一旦活跃名称节点出现故障，就可以立即切换到待命名称节点 •Zookeeper确保一个名称节点在对外服务 •名称节点维护映射信息，数据节点同时向两个名称节点汇报信息 Zookeeper 故障恢复控制器（活跃）故障恢复控制器（待命）名称节点（活跃）名称节点（待命）心跳心跳监控名称节点健康状态监控名称节点健康状态命令共享存储系统（NFS、QJM或Zookeeper）数据节点 ... 向名称节点汇报自己保存的块信息 Zookeeper Zookeeper 数据节点数据节点向名称节点汇报自己保存的块信息命令

g 8.2.2HDFS Federation 1HDFS10中存在的问题单点故障问题不可以水平扩展(是否可以通过纵向扩展来解决?) 系统整体性能受限于单个名称节点的吞吐量单个名称节点难以提供不同程序之间的隔离性 HDES HA是热备份,提供高可用性,但是无法解决可扩展性、系统性能和隔离性 2 HDES Federation的设计 1名称节点1 名称节点 1名称节点n 在 HDFS Federation中,设计了多个相互独立的名称节点,使得 HDFS的命名服务能够水平扩展,}/命名空间命名空间k、1… 命名空间n 这些名称节点分别进行各自命名空间和块的管理,相互之间是联盟( Federation)关系,不需要}块池1 块池k 块池n 彼此协调。并且向后兼容 hdfs federation中,所有名称节点会共享底层的数据节点存储(数据节点1 数据节点2 数据节点m 资源,数据节点向所有名称节点公共存储汇报属于同一个命名空间的块构成一个“块池”图 HDFS Federation架构大数据技术原理与应用(第3版厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 8.2.2HDFS Federation •单点故障问题 •不可以水平扩展（是否可以通过纵向扩展来解决？） •系统整体性能受限于单个名称节点的吞吐量 •单个名称节点难以提供不同程序之间的隔离性 •HDFS HA是热备份，提供高可用性，但是无法解决可扩展性、系统性能和隔离性图 HDFS Federation架构 •在HDFS Federation中，设计了多个相互独立的名称节点，使得 HDFS的命名服务能够水平扩展，这些名称节点分别进行各自命名空间和块的管理，相互之间是联盟（Federation）关系，不需要彼此协调。并且向后兼容 •HDFS Federation中，所有名称节点会共享底层的数据节点存储资源，数据节点向所有名称节点汇报 •属于同一个命名空间的块构成一个“块池” NS1 块池Po1ol 1 名称节点1 NS1 块池Pokol 1 NS1 块池Ponol 1 数据节点1 数据节点2 数据节点m ... ... 公共存储 ... 名称节点k 名称节点n 命名空间1 命名空间k 命名空间n 2.HDFS Federation的设计 1.HDFS1.0中存在的问题

g 8.2.2HDFS Federation 3. HDFS Federation的访问方式 °对于 Federation中的多个命名空间,可以采用客户端挂载表( Client Side Mount Table)方式进行数据共享和访问 Client-side ·客户可以访问不同的挂载点来访问不同的子命名空间 Mount-table 把各个命名空间挂载到全局“挂载表” ( mount-table)中,实现数据全局共享同样的命名空间挂载到个人的挂载表中, 就成为应用程序可见的命名空间名称节点1维护每个阴影三角形的命名空间代表一个独立的命名空间名称节点2维护的命名空间图客户端挂载表方式访问多个命名空间大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 8.2.2HDFS Federation / Client-side Mount-table data project home tmp 图客户端挂载表方式访问多个命名空间 •对于Federation中的多个命名空间，可以采用客户端挂载表（Client Side Mount Table）方式进行数据共享和访问 •客户可以访问不同的挂载点来访问不同的子命名空间 •把各个命名空间挂载到全局“挂载表” （mount-table）中，实现数据全局共享 •同样的命名空间挂载到个人的挂载表中，就成为应用程序可见的命名空间 3. HDFS Federation的访问方式每个阴影三角形代表一个独立的命名空间名称节点1维护的命名空间名称节点2维护的命名空间

g 8.2.2HDFS Federation 4 HDFS Federation相对于HDFS1.0的优势 HDFS Federation设计可解决单名称节点存在的以下几个问题 (1)HDFs集群扩展性。多个名称节点各自分管一部分目录,使得一个集群可以扩展到更多节点,不再像HDFS1.0中那样由于内存的限制制约文件存储数目 (2)性能更高效。多个名称节点管理不同的数据,且同时对外提供服务, 将为用户提供更高的读写吞吐率 (3)良好的隔离性。用户可根据需要将不同业务数据交由不同名称节点管理,这样不同业务之间影响很小需要注意的, HDFS Federation并不能解决单点故障问题,也就是说,每个名称节点都存在在单点故障问题,需要为每个名称节点部署一个后备名称节点,以应对名称节点挂掉对业务产生的影响大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 8.2.2HDFS Federation HDFS Federation设计可解决单名称节点存在的以下几个问题：（1）HDFS集群扩展性。多个名称节点各自分管一部分目录，使得一个集群可以扩展到更多节点，不再像HDFS1.0中那样由于内存的限制制约文件存储数目（2）性能更高效。多个名称节点管理不同的数据，且同时对外提供服务，将为用户提供更高的读写吞吐率（3）良好的隔离性。用户可根据需要将不同业务数据交由不同名称节点管理，这样不同业务之间影响很小需要注意的，HDFS Federation并不能解决单点故障问题，也就是说，每个名称节点都存在在单点故障问题，需要为每个名称节点部署一个后备名称节点，以应对名称节点挂掉对业务产生的影响 4.HDFS Federation相对于HDFS1.0的优势

8.3新一代资源管理调度框架YARN 831 MapReduce1.0的缺陷 8.32YARN设计思路 833YARN体系结构 8.34YARN工作流程 835YARN框架与 MapReduce1.0框架的对比分析 836YARN的发展目标大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 8.3新一代资源管理调度框架YARN 8.3.1 MapReduce1.0的缺陷 8.3.2 YARN设计思路 8.3.3 YARN体系结构 8.3.4 YARN工作流程 8.3.5YARN框架与MapReduce1.0框架的对比分析 8.3.6 YARN的发展目标

点击进入文档下载页（PPT格式）

共51页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

厦门大学：《数据库系统原理》课程教学资源（PPT课件讲稿，2016版）第四章数据库安全性
厦门大学：《数据库系统原理》课程教学资源（PPT课件讲稿，2016版）第一章绪论（林子雨）
厦门大学数据库实验室论文阅读报告二
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）课程介绍（主讲：林子雨）
厦门大学：《计算机应用基础》PPT讲义课件_第一章信息与计算机基础
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）第一章大数据概述
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）第六章云数据库
厦门大学：《Spark编程基础》课程教学PPT讲义课件（Python版）第4章 RDD编程
厦门大学：《Spark编程基础》课程教学PPT讲义课件（Scala版）第1章大数据技术概述
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）第七章 MapReduce
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）第八章流计算（主讲：林子雨）
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（习题，原书第4版）chapter 8 Future Trends, Privacy and Managerial Considerations in Analytics
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第2版）第3章分布式文件系统HDFS
厦门大学：《Spark编程基础》课程教学PPT讲义课件（Scala版）第5章 RDD编程
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第7章 MapReduce
厦门大学：《大数据处理技术 Spark》课程讲义（PPT教学课件）第1章大数据技术概述
厦门大学：《大数据处理技术 Spark》课程讲义（PPT教学课件）第2章 Scala语言基础
厦门大学：《大数据导论》课程讲义（PPT教学课件）第7章数据处理与分析
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第2版）课程介绍（主讲：林子雨）
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第3章分布式文件系统HDFS
厦门大学：《计算机应用基础》PPT讲义课件_第二章操作系统Windows XP
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第6章云数据库
复旦大学：《高级Web技术》课程教学大纲（戴开宇）
《高级Web技术》参考资料：MyEclipse创建基于X-File的Web service及调用实例详解

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录