8.1 流计算概述 8.2 流计算处理流程 8.3 流计算应用 8.4 流计算开源框架 - Storm
文件格式: PDF大小: 1.34MB页数: 49
• 7.1 图计算简介 • 7.2 Pregel简介 • 7.3 Pregel图计算模型 • 7.4 Pregel的C++ API • 7.5 Pregel的体系结构 • 7.6 Pregel的应用实例 • 7.7 Pregel和MapReduce实现PageRank算法的对比 • 7.8 Hama的安装和使用
文件格式: PDF大小: 826.33KB页数: 65
• 6.1 概述 • 6.2 HBase访问接口 • 6.3 HBase数据模型 • 6.4 HBase的实现原理 • 6.5 HBase运行机制 • 6.6 HBase编程实践
文件格式: PDF大小: 2.31MB页数: 73
• 5.1 分布式文件系统 • 5.2 HDFS简介 • 5.3 HDFS相关概念 • 5.4 HDFS体系结构 • 5.5 HDFS存储原理 • 5.6 HDFS大数据读写过程 • 5.7 HDFS编程实践
文件格式: PDF大小: 758.35KB页数: 38
分布式并行编程:编程方式的变革 MapReduce模型概述 Map和Reduce函数 MapReduce工作流程 并行计算的实现 实例分析:WordCount 新MapReduce框架Yarn
文件格式: PDF大小: 1.45MB页数: 85
Hadoop概述 Hadoop发展简史 Hadoop的功能与作用 为什么不用关系型数据库管理系统 Hadoop优点 Hadoop的应用现状和发展趋势 Hadoop项目及其结构 Hadoop的体系结构 Hadoop与分布式开发 Hadoop应用案例 Hadoop平台上的海量数据排序
文件格式: PDF大小: 1.55MB页数: 54
大数据处理的基本流程 大数据处理模型 大数据关键技术 大数据处理工具 大数据时代面临的新挑战 WordCount 关联规则基本模型 聚类 本章内容首先介绍了大数据处理的基本流程和大数据处理模型,接着介绍了大数据的关键技术,其中,云计算是大数据的基础平台和支撑技术,本章以Google 的相关技术为主线,详细介绍Google 以及其他众多学者和研究机构在大数据技术方面已有的一些工作,包括文件系统、数据库系统、索引和查询技术、数据分析技术等;接下来,介绍了大数据处理平台和工具,就目前技术发展现状而言,Hadoop 已经成为了大数据处理工具事实上的标准。最后,介绍大数据时代面临的新挑战,包括大数据集成、大数据分析、大数据隐私问题、大数据能耗问题、大数据处理与硬件的协同、大数据管理易用性问题以及性能测试基准。 大数据采集架构 预测模型
文件格式: PDF大小: 3.89MB页数: 162
课程评价、考核资料清单、要求及说明 数据挖掘技术 大数据工作思路 大数据概述与应用 大数据现状与问题 基本概念简述 大数据采集与预处理 大数据存储与管理 大数据计算模式 大数据分析与挖掘 大数据可视化分析 大数据安全
文件格式: PDF大小: 12.43MB页数: 114
12.1 用户画像和精准营销 12.2 广告推荐 12.3 互联网金融 12.4 实战:个人贷款风险评估
文件格式: PDF大小: 1.88MB页数: 44
12.1 推荐系统概述 12.2 推荐算法 – 协同过滤 12.3 协同过滤实践 – 电影推荐系统
文件格式: PDF大小: 807.13KB页数: 29