当前位置：和泉文库 > 计算机 > 浏览文档

厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第3章分布式文件系统HDFS

• 3.1 分布式文件系统 • 3.2 HDFS简介 • 3.3 HDFS相关概念 • 3.4 HDFS体系结构 • 3.5 HDFS存储原理 • 3.6 HDFS数据读写过程 • 3.7 HDFS编程实践

文件格式：PPT，文件大小：5.59MB，售价：15.86元

文档详细内容（约69页）

332名称节点和数据节点名称节点运行期间 EditLog不断变大的问题在名称节点运行期间,HDFS的所有更新操作都是直接写到 EditLog中,久而久之, EditLog文件将会变得很大 ·虽然这对名称节点运行时候是没有什么明显影响的,但是,当名称节点重启的时候,名称节点需要先将 FsImage里面的所有内容映像到内存中,然后再一条一条地执行EdtL!og中的记录,当 EditLog文件非常大的时候,会导致名称节点启动操作非常慢,而在这段时间内HDFS系统处于安全模式直无法对外提供写操作,影响了用户的使用如何解决?答案是: Secondary NameNode第二名称节点第二名称节点是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS 元数据信息的备份,并减少名称节点重启的时间。 Secondary NameNode一般是单独运行在一台机器上大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 3.3.2名称节点和数据节点 •在名称节点运行期间，HDFS的所有更新操作都是直接写到EditLog中，久而久之， EditLog文件将会变得很大 •虽然这对名称节点运行时候是没有什么明显影响的，但是，当名称节点重启的时候，名称节点需要先将FsImage里面的所有内容映像到内存中，然后再一条一条地执行EditLog中的记录，当EditLog文件非常大的时候，会导致名称节点启动操作非常慢，而在这段时间内HDFS系统处于安全模式，一直无法对外提供写操作，影响了用户的使用名称节点运行期间EditLog不断变大的问题如何解决？答案是：SecondaryNameNode第二名称节点第二名称节点是HDFS架构中的一个组成部分，它是用来保存名称节点中对HDFS 元数据信息的备份，并减少名称节点重启的时间。SecondaryNameNode一般是单独运行在一台机器上

332名称节点和数据节点 Primary Namenode Secondary Namenode Secondary Name Node的工作情况: (1) Secondary NameNode会定期和 Name Node通信,请求其停止使用 EditLog 文件,暂时将新的写操作写到一个新的文件 1. Roll edits edit new上来,这个操作是瞬间完成,上层 2. Retrieve simage and edits from primary 写日志的函数完全感觉不到差别 edits, new (2)SecondaryNameNode通过HTTP GET方式从 Name Node上获取到 FsImage和 EditLog文件,并下载到本地的相应目录下 ma age (3) SecondaryName Node将下载下 3. Merge 来的 Fslmage载入到内存,然后一条一条地执行 EditLog文件中的各项更新操作,使得 fsimage ckpt 内存中的 Fslmaget保持最新;这个过程就是 EdtL!og和 Fslmage文件合并 (4) SecondaryName Node执行完(3 4. Transfer checkpoint to primary )操作之后,会通过post方式将新的 fsimage ckpt Fslmage文件发送到 NameNode节点上 5. Roll 5) Name Node将从 fsimage ckpt Secondary Name Node接收到的新的 Fslmage替换旧的 Fslmage文件,同时将 edit new替换 EditLog文件,通过这个过程 EditLog就变小了大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 3.3.2名称节点和数据节点 SecondaryNameNode的工作情况：（1）SecondaryNameNode会定期和 NameNode通信，请求其停止使用EditLog 文件，暂时将新的写操作写到一个新的文件 edit.new上来，这个操作是瞬间完成，上层写日志的函数完全感觉不到差别；（2）SecondaryNameNode通过HTTP GET方式从NameNode上获取到FsImage和 EditLog文件，并下载到本地的相应目录下；（3）SecondaryNameNode将下载下来的FsImage载入到内存，然后一条一条地执行EditLog文件中的各项更新操作，使得内存中的FsImage保持最新；这个过程就是 EditLog和FsImage文件合并；（4）SecondaryNameNode执行完（3 ）操作之后，会通过post方式将新的 FsImage文件发送到NameNode节点上（5）NameNode将从 SecondaryNameNode接收到的新的 FsImage替换旧的FsImage文件，同时将 edit.new替换EditLog文件，通过这个过程 EditLog就变小了

332名称节点和数据节点数据节点( DataNode) ·数据节点是分布式文件系统HDFS的工作节点,负责数据的存储和读取,会根据客户端或者是名称节点的调度来进行数据的存储和检索,并且向名称节点定期发送自己所存储的块的列表每个数据节点中的数据会被保存在各自节点的本地LnuX文件系统中大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 3.3.2名称节点和数据节点 •数据节点是分布式文件系统HDFS的工作节点，负责数据的存储和读取，会根据客户端或者是名称节点的调度来进行数据的存储和检索，并且向名称节点定期发送自己所存储的块的列表 •每个数据节点中的数据会被保存在各自节点的本地Linux文件系统中数据节点（DataNode）

34HDFS体系结构 ·34.1 HDFS体系结构概述 ·3.4.2 HDFS命名空间管理 34.3 通信协议 ·344客户端 ·3.4.5 HDFS体系结构的局限性大数据技术原理与应用(第3 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 3.4 HDFS体系结构 • 3.4.1 HDFS体系结构概述 • 3.4.2 HDFS命名空间管理 • 3.4.3 通信协议 • 3.4.4 客户端 • 3.4.5 HDFS体系结构的局限性

34HDFS体系结构概述 HDFS采用了主从( Master/Slave)结构模型,一个HDFS集群包括个名称节点( NameNode)和若干个数据节点( Datanode)(如图34所示)。名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问。集群中的数据节点一般是一个节点运行一个数据节点进程 ,负责处理文件系统客户端的读/写请求,在名称节点的统一调度下进行数据块的创建、删除和复制等操作。每个数据节点的数据实际上是保存在本地 Linux文件系统中的客户端文件名或数据块号名称节点 (Client) (Name Node) 数据块号、数据块位置写数据读数据数据节点数据节点数据节点数据节点 (DataNode) (DataNode ( DataNode (DataNode 本地 Linux文件系统本地 Linux文件系统本地 Linux文件系统本地 linux文件系统备份机架1 机架n 图3-4HDFS体系结构大数据技术原理与应用(第3版厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

《大数据技术原理与应用（第3版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 3.4.1HDFS体系结构概述 HDFS采用了主从（Master/Slave）结构模型，一个HDFS集群包括一个名称节点（NameNode）和若干个数据节点（DataNode）（如图3-4所示）。名称节点作为中心服务器，负责管理文件系统的命名空间及客户端对文件的访问。集群中的数据节点一般是一个节点运行一个数据节点进程，负责处理文件系统客户端的读/写请求，在名称节点的统一调度下进行数据块的创建、删除和复制等操作。每个数据节点的数据实际上是保存在本地Linux文件系统中的机架n 本地Linux文件系统本地Linux文件系统数据节点（DataNode）数据节点（DataNode） …… 客户端 (Client) 名称节点 (NameNode) 备份文件名或数据块号 …… 机架1 本地Linux文件系统本地Linux文件系统数据节点 (DataNode) 数据节点（DataNode） …… 数据块号、数据块位置写数据读数据图3-4 HDFS体系结构

点击进入文档下载页（PPT格式）

共69页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第2版）课程介绍（主讲：林子雨）
厦门大学：《大数据导论》课程讲义（PPT教学课件）第7章数据处理与分析
厦门大学：《大数据处理技术 Spark》课程讲义（PPT教学课件）第2章 Scala语言基础
厦门大学：《大数据处理技术 Spark》课程讲义（PPT教学课件）第1章大数据技术概述
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第7章 MapReduce
厦门大学：《Spark编程基础》课程教学PPT讲义课件（Scala版）第5章 RDD编程
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第2版）第3章分布式文件系统HDFS
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第8章 Hadoop架构再探讨
厦门大学：《数据库系统原理》课程教学资源（PPT课件讲稿，2016版）第四章数据库安全性
厦门大学：《数据库系统原理》课程教学资源（PPT课件讲稿，2016版）第一章绪论（林子雨）
厦门大学数据库实验室论文阅读报告二
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）课程介绍（主讲：林子雨）
厦门大学：《计算机应用基础》PPT讲义课件_第二章操作系统Windows XP
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，第3版）第6章云数据库
复旦大学：《高级Web技术》课程教学大纲（戴开宇）
《高级Web技术》参考资料：MyEclipse创建基于X-File的Web service及调用实例详解
《高级Web技术》参考资料：Architectural Styles and the design of Network-based Software Achitectures
《高级Web技术》参考资料：MyEclipse 6 Java 开发中文教程_第十一章开发Spring+Struts+Hibernate应用
《高级Web技术》参考资料：Spring中文教程（Spring Framework开发参考手册 version 1.1）
《高级Web技术》参考资料：MyEclipse 6 Java 开发中文教程_第十六章开发EJB应用
《高级Web技术》参考资料：MyEclipse 6 Java 开发中文教程_第十五章开发XFire Web Service应用
《高级Web技术》参考资料：深入Spring 2：轻量级J2EE开发框架原理与实践_第五章面向切面的编程（AOP）及在Spring中的应用
《高级Web技术》参考资料：SSH Step by Step Tutorial
《高级Web技术》参考资料：Building Social Web Applications

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录