当前位置：和泉文库 > 计算机 > 浏览文档

重庆大学：《大数据技术基础》课程教学资源（课件讲稿）08 流计算 Stream Computing

8.1 流计算概述 8.2 流计算处理流程 8.3 流计算应用 8.4 流计算开源框架 - Storm

文件格式：PDF，文件大小：1.34MB，售价：13.74元

共49页，可试读17页，点击往前阅读 ↑↑

文档详细内容（约49页）

81.2批量计算和实时计算对静态数据和流数据的处理,对应着两种截然不同的计算模式:批量计算和实时计算处理逻辑流数据 (动态数据) 静态数据处理逻辑价值丢弃价值批量计算实时计算数据的两种处理模型

• 对静态数据和流数据的处理，对应着两种截然不同的计算模式：批量计算和实时计算 8.1.2 批量计算和实时计算数据的两种处理模型

81.2批量计算和实时计算批量计算以“静态数据”为对象,可在充裕的时间内对海量数据进行批量处理,计算得到有价值的信息。 Hadoop是典型的批处理模型, 由HDFS和 HBase存放大量的静态数据,由 MapReduce负责对海量数据执行批量计算流数据须釆用实时计算。实时计算最重要的一个需求是能够实时得到计算结果,一般要求响应时间为秒级。当只需要处理少量数据时,实时计算并不是问题;但是,在大数据时代,数据格式复杂、来源众多、数据量巨大,对实时计算提出了很大的挑战。因此,针对流数据的实时计算—流计算,应运而生

• 批量计算以“静态数据”为对象，可在充裕的时间内对海量数据进行批量处理，计算得到有价值的信息。Hadoop是典型的批处理模型，由HDFS和HBase存放大量的静态数据，由MapReduce负责对海量数据执行批量计算 • 流数据须采用实时计算。实时计算最重要的一个需求是能够实时得到计算结果，一般要求响应时间为秒级。当只需要处理少量数据时，实时计算并不是问题；但是，在大数据时代，数据格式复杂、来源众多、数据量巨大，对实时计算提出了很大的挑战。因此，针对流数据的实时计算——流计算，应运而生 8.1.2 批量计算和实时计算

813流计算概念流计算:实时获取来自不同数据源的海量数据,经过实时分析处理,获得有价值的信息描数据采集实时分析处理》结果反馈流计算示意图

• 流计算：实时获取来自不同数据源的海量数据，经过实时分析处理，获得有价值的信息 8.1.3 流计算概念流计算示意图

813流计算概念流计算秉承一个基本理念,即数据的价值随着时间的流逝而降低。因此,当事件出现时就应该立即进行处理,而不是缓存起来进行批量处理。为了及时处理流数据,就需要一个低延迟、可扩展、高可靠的处理引擎对于一个流计算系统来说,它应达到如下需求: 髙性能:处理大数据的基本要求,如每秒处理几十万条数据一海量式:支持TB级甚至是PB级的数据规模实时性:保证较低的延迟时间,达到秒级别,甚至是毫秒级别分布式:支持大数据的基本架构,必须能够平滑扩展易用性:能够快速进行开发和部署可靠性:能可靠地处理流数据

• 流计算秉承一个基本理念，即数据的价值随着时间的流逝而降低。因此，当事件出现时就应该立即进行处理，而不是缓存起来进行批量处理。为了及时处理流数据，就需要一个低延迟、可扩展、高可靠的处理引擎 • 对于一个流计算系统来说，它应达到如下需求： – 高性能：处理大数据的基本要求，如每秒处理几十万条数据 – 海量式：支持TB级甚至是PB级的数据规模 – 实时性：保证较低的延迟时间，达到秒级别，甚至是毫秒级别 – 分布式：支持大数据的基本架构，必须能够平滑扩展 – 易用性：能够快速进行开发和部署 – 可靠性：能可靠地处理流数据 8.1.3 流计算概念

814流计算与 Hadoop Hadoop设计的初衷是面向大规模数据的批量处理,每台机器并行运行 MapReduce任务,最后对结果进行汇总输出 MapReduce是专门面向静态数据的批量处理的,内部各种实现机制都为批处理做了高度优化,不适合用于处理持续到达的动态数据我们可能会想到一种“变通”的方案来降低批处理的时间延迟一一将基于 MapReduce的批量处理转为小批量处理,将输入数据切成小的片段,每隔一个周期就启动一次 MapReduce作业。但这种方式也无法有效处理流数据

• Hadoop设计的初衷是面向大规模数据的批量处理，每台机器并行运行MapReduce任务，最后对结果进行汇总输出 • MapReduce是专门面向静态数据的批量处理的，内部各种实现机制都为批处理做了高度优化，不适合用于处理持续到达的动态数据 • 我们可能会想到一种“变通”的方案来降低批处理的时间延迟——将基于MapReduce的批量处理转为小批量处理，将输入数据切成小的片段，每隔一个周期就启动一次MapReduce作业。但这种方式也无法有效处理流数据 8.1.4 流计算与Hadoop

点击进入文档下载页（PDF格式）

共49页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

重庆大学：《大数据技术基础》课程教学资源（课件讲稿）07 图计算 Graph Computing
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）06 HBase
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）05 HDFS
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）04 MapReduce
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）03 Hadoop
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）02 大数据关键技术与挑战
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）01 大数据概述
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）13 大数据技术应用（大数据商业应用）
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）12 大数据技术应用（应用举例）
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）11 NoSQL数据库
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）10 数据可视化 Visualization
重庆大学：《计算机图形学》课程教学课件（讲义）07 数字分析技术——空间句法
重庆大学：《大数据技术基础》课程教学资源（课件讲稿）09 Spark内存计算
重庆师范大学：《人工智能》精品课程PPT教学课件_VR虚拟现实和AR增强现实技术
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_绪论、第1章人工智能概述
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第2章知识表示
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第3章推理技术
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第4章智能计算（计算智能）
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第5章搜索策略
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第6章机器学习
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第7章机器人规划
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 1 introduction
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 2 about data - Getting to Know Your Data
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 3 Data Preprocessing

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录