Pass-Join: A Partition-based Method for Similarity Joins Trie-Join: Efficient Trie-based String Similarity Joins with Edit-Distance Constraints
文件格式: PPT大小: 1.23MB页数: 28
1.课程特色 2.教材介绍 2.内容提要 3.篇章安排 4.班级介绍
文件格式: PPT大小: 4.62MB页数: 16
1.1 信息 1.1.1 信息概述 1.1.2 信息技术的发展 1.1.3 计算机技术的发展 1.2 计算机中的信息表示 1.2.1 进位计数制 1.2.2 不同计数制之间的转换 1.2.3 计算机使用二进制数 1.2.4 计算机信息编码技术 1.3 计算机系统 1.3.1 硬件系统 1.3.2 软件系统
文件格式: PPT大小: 1.59MB页数: 49
1.1 大数据时代 1.2 大数据概念 1.3 大数据的影响 1.4 大数据的应用 1.5 大数据关键技术 1.6 大数据计算模式 1.7 大数据产业 1.8 大数据与云计算、物联网的关系
文件格式: PPT大小: 9.36MB页数: 39
• 6.1 云数据库概述 • 6.1.1 云计算是云数据库兴起的基础 • 6.1.2 云数据库概念 • 6.1.3 云数据库的特性 • 6.1.4 云数据库是个性化数据存储需求的理想选择 • 6.1.5 云数据库与其他数据库的关系 • 6.2 云数据库产品 • 6.2.1 云数据库厂商概述 • 6.2.2 Amazon的云数据库产品 • 6.2.3 Google的云数据库产品 • 6.2.4 Microsoft的云数据库产品 • 6.2.5 其他云数据库产品 • 6.3 云数据库系统架构 • 6.3.1 UMP系统概述 • 6.3.2 UMP系统架构 • 6.3.3 UMP系统功能 • 6.4 Amazon AWS和云数据库 6.4.1 Amazon和云计算的渊源 6.4.2 Amazon AWS 6.4.3 Amazon AWS平台上的云数据库 • 6.5 微软云数据库SQL Azure • 6.6 云数据库实践 6.6.1 阿里云RDS简介 6.6.2 RDS中的概念 6.6.3 购买和使用RDS数据库 6.6.4 将本地数据库迁移到云端RDS数据库
文件格式: PPT大小: 3.79MB页数: 75
4.1 RDD编程基础 4.1.1 RDD创建 4.1.2 RDD操作 4.1.3 持久化 4.1.4 分区 4.1.5 一个综合实例 4.2 键值对RDD 4.2.1 键值对RDD的创建 4.2.2 常用的键值对RDD转换操作 4.2.3 一个综合实例 4.3 数据读写 4.3.1 文件数据读写 4.3.2 读写HBase数据 4.4 综合案例 4.4.1 案例1:求TOP值 4.4.2 案例2:文件排序 4.4.3 案例3:二次排序
文件格式: PPT大小: 4.46MB页数: 107
1.1 大数据时代 1.2 大数据概念 1.3 大数据的影响 1.4 大数据关键技术 1.5 大数据计算模式 1.6 代表性大数据技术
文件格式: PPT大小: 7.74MB页数: 46
• 7.1 概述 • 7.2 MapReduce体系结构 • 7.3 MapReduce工作流程 • 7.4 实例分析:WordCount • 7.5 MapReduce的具体应用 • 7.6 MapReduce编程实践
文件格式: PPT大小: 3MB页数: 41
8.1 流计算概述 • 8.1.1 静态数据和流数据 • 8.1.2 批量计算和实时计算 • 8.1.3 流计算概念 • 8.1.4 流计算与Hadoop • 8.1.5 流计算框架 8.2 流计算处理流程 • 8.2.1 概述 • 8.2.2 数据实时采集 • 8.2.3 数据实时计算 • 8.2.4 实时查询服务 8.3 流计算应用 8.4 流计算开源框架 – Storm • 8.4.1 Storm简介 • 8.4.2 Storm的特点 • 8.4.3 Storm设计思想 • 8.4.4 Storm框架设计 8.5 Spark Streaming 8.5.1 Spark Streaming设计 8.5.2 Spark Streaming与Storm的对比 8.6 Samza 8.6.1 基本概念 8.6.2 系统架构 8.7 Storm、Spark Streaming和Samza的应用场景 8.8 Storm编程实践 8.8.1 编写Storm程序 8.8.2 安装Storm的基本过程 8.8.3 运行Storm程序
文件格式: PPT大小: 3.33MB页数: 71
8.1 Explore some of the emerging technologies that may impact analytics, business intelligence (BI), and decision support 8.2 Describe the emerging Internet of Things (IoT) phenomenon, potential applications, and the IoT ecosystem 8.3 Describe the current and future use of cloud computing in business analytics 8.4 Describe how geospatial and location-based analytics are assisting organizations 8.5 Describe the organizational impacts of analytics applications 8.6 List and describe the major ethical and legal issues of analytics implementation 8.7 Identify key characteristics of a successful data science professional
文件格式: PPTX大小: 1.69MB页数: 53










