当前位置：和泉文库 > 计算机 > 浏览文档

重庆大学：《大数据技术基础》课程教学资源（课件讲稿）03 Hadoop

Hadoop概述 Hadoop发展简史 Hadoop的功能与作用为什么不用关系型数据库管理系统 Hadoop优点 Hadoop的应用现状和发展趋势 Hadoop项目及其结构 Hadoop的体系结构 Hadoop与分布式开发 Hadoop应用案例 Hadoop平台上的海量数据排序

文件格式：PDF，文件大小：1.55MB，售价：15元

共54页，可试读18页，点击往前阅读 ↑↑

文档详细内容（约54页）

Hadoop的体系结构从上面的介绍可以看出,HDFS和 Mapreduce共同组成了 Hadoop 分布式系统体系结构的核心。HDFS在集群上实现了分布式文件系统, MapReduce在集群上实现了分布式计算和任务处理。HDFS在 Mapreduce任务处理过程中提供了文件操作和存储等支持, Mapreduce在HDFS的基础上实现了任务的分发、跟踪、执行等工作, 并收集结果,二者相互作用,完成了 Hadoop分布式集群的主要任务。《大数据技术基础》

《大数据技术基础》 Hadoop的体系结构从上面的介绍可以看出，HDFS和MapReduce共同组成了Hadoop 分布式系统体系结构的核心。HDFS在集群上实现了分布式文件系统， MapReduce 在集群上实现了分布式计算和任务处理。HDFS在 MapReduce任务处理过程中提供了文件操作和存储等支持， MapReduce在HDFS的基础上实现了任务的分发、跟踪、执行等工作，并收集结果，二者相互作用，完成了Hadoop分布式集群的主要任务

Hadoop与分布式开发 Hadoop上的并行应用程序开发是基于 Map Reduce编程框架的 MapReduce编程模型的原理是:利用一个输入的key/ value对集合来产生一个输出的key/ value对集合。 Mapreduce库的用户用两个函数来表达这个计算:Map和 Reduce 用户自定义的map函数接收一个输入的 key/value对,然后产生个中间 key/value对的集合。 MapReduce把所有具有相同key值的 value集合在一起,然后传递给 reduce函数。用户自定义的 reduce函数接收key和相关的 value集合。 reduce函数合并这些 value值,形成个较小的vaue集合。一般来说,每次 reduce函数调用只产生0或1个输出的 value值。通常我们通过一个迭代器把中间的 value值提供给 reduce函数,这样就可以处理无法全部放入内存中的大量的 value值集《大数据技术基础》

《大数据技术基础》 Hadoop与分布式开发 Hadoop上的并行应用程序开发是基于MapReduce 编程框架的。 MapReduce 编程模型的原理是：利用一个输入的key/value 对集合来产生一个输出的key/value 对集合。MapReduce库的用户用两个函数来表达这个计算：Map 和Reduce。用户自定义的map函数接收一个输入的key/value 对，然后产生一个中间key/value 对的集合。MapReduce 把所有具有相同key 值的 value 集合在一起，然后传递给reduce 函数。用户自定义的reduce 函数接收key 和相关的value 集合。reduce 函数合并这些value 值，形成一个较小的value 集合。一般来说，每次reduce 函数调用只产生0 或1 个输出的value值。通常我们通过一个迭代器把中间的value 值提供给 reduce 函数，这样就可以处理无法全部放入内存中的大量的value 值集合了

Hadoop与分布式开发下图是 Mapreduce的数据流图,这个过程简而言之就是将大数据集分解为成百上千个小数据集,每个(或若干个)数据集分别由集群中的一个节点(一般就是一台普通的计算机)进行处理并生成中间结果 ,然后这些中间结果又由大量的节点合并,形成最终结果。图8-4也指出了 Mapreduce框架下并行程序中的三个主要函数:map、 reduce、 main。在这个结构中,需要用户完成的工作仅仅是根据任务编写map 和 reduce两个函数。输入数据排序排序合并输出数据数据片段>m- >mahout reduce- Ireduce-out-数据片段)HDF副本数据片段→>mp-)m |- reduce- reduce-oud-x数片段>HDS副本数据片段→m甲-→mu→ 《大数据技术基础》

《大数据技术基础》 Hadoop与分布式开发下图是MapReduce 的数据流图，这个过程简而言之就是将大数据集分解为成百上千个小数据集，每个（或若干个）数据集分别由集群中的一个节点（一般就是一台普通的计算机）进行处理并生成中间结果，然后这些中间结果又由大量的节点合并，形成最终结果。图8-4也指出了MapReduce 框架下并行程序中的三个主要函数：map、reduce、 main。在这个结构中，需要用户完成的工作仅仅是根据任务编写map 和reduce 两个函数

点击进入文档下载页（PDF格式）

共54页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

重庆大学：《大数据技术基础》课程教学资源（课件讲稿）02 大数据关键技术与挑战
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）01 大数据概述
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）13 大数据技术应用（大数据商业应用）
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）12 大数据技术应用（应用举例）
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）11 NoSQL数据库
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）10 数据可视化 Visualization
重庆大学：《计算机图形学》课程教学课件（讲义）07 数字分析技术——空间句法
重庆大学：《计算机图形学》课程教学课件（讲义）06 BIM技术——基于自主规则设定的全方位碰撞检查技术 Building Informationg Modeling —The Omni-bearing Collision Check Technology Based on Rule Definition
重庆大学：《计算机图形学》课程教学课件（讲义）05 BIM模型建模技术——ArchiCAD 虚拟建筑——BIM为建筑设计领域带来了第二次革命
重庆大学：《计算机图形学》课程教学课件（讲义）04 数字化建筑设计理论与方法——建筑信息模型（建筑BIM技术）
重庆大学：《计算机图形学》课程教学课件（讲义）03 CAD技术的五次重大革命
重庆大学：《计算机图形学》课程教学课件（讲义）02 数字建筑——-非线性建筑案例分析非线性建筑 & 参数化主义 Non - linear Architecture & PARAMETRICISM
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）04 MapReduce
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）05 HDFS
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）06 HBase
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）07 图计算 Graph Computing
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）08 流计算 Stream Computing
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）09 Spark内存计算
重庆师范大学：《人工智能》精品课程PPT教学课件_VR虚拟现实和AR增强现实技术
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_绪论、第1章人工智能概述
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第2章知识表示
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第3章推理技术
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第4章智能计算（计算智能）
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第5章搜索策略

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录