大数据时代的背景 数据量增加 数据结构日趋复杂 大量新数据源的出现则导致了非结构化、 0s0 半结构化数据爆发式的增长 2010 根据IDC监测,人类产生的数据量正在呈指数级 增长,大约每两年翻一番,这个速度在2020年 前会继续保持下去。这意味着人类在最近两年产生 的数据量相当于之前产生的全部数据量。 TB→PB= EBBZB 这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理 的范畴 大数据时代正在来临
数据量增加 TB PB EB ZB 根据IDC 监测,人类产生的数据量正在呈指数级 增长,大约每两年翻一番,这个速度在2020 年之 前会继续保持下去。这意味着人类在最近两年产生 的数据量相当于之前产生的全部数据量。 数据结构日趋复杂 大量新数据源的出现则导致了非结构化、 半结构化数据爆发式的增长 ▪这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理 的范畴 ▪大数据时代正在来临… 大数据时代的背景
大数据时代的背景 20世纪90年代,数据仓库之父的 Bill Inmon就经常 提及 Big Data EMC 2011年5月,在“云计算相遇大数据”为主题的EMC whore information livor World2011会议中,EMC抛出了 Big Data概念。 COMPANY LOGOTYPE INSERT
20世纪90年代,数据仓库之父的Bill Inmon就经常 提及Big Data。 2011年5月,在“云计算相遇大数据”为主题的EMC World 2011 会议中,EMC 抛出了Big Data概念。 大数据时代的背景
大数据的4V特征 非结构化数据的超大规模和增长 体量 Volume ·占总数据量的80~90% 比结构化数据增长快10倍到50倍 是传统数据仓库的10倍到50倍 大数据的异构和多样性 多样性 Variety ·很多不同形式(文本、图像、视频、机器数据 无模式或者模式不明显 不连贯的语法或句义 大量的不相关信息 价值密度vaue 对未来趋势与模式的可预测分析 深度复杂分析(机器学习、人工智能Vs传统商务 智能(咨询、报告等) 实时分析而非批量式分析 速度 Velocity 数据输入、处理与丢弃 立竿见影而非事后见效 大量化(oume)、多样化 Variety)、快速化( elocity)、价值密度低(vaue)”就是 大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据 COMPANY LOGOTYPE INSERT
体量Volume 多样性Variety 价值密度Value 速度Velocity 非结构化数据的超大规模和增长 •占总数据量的80~90% •比结构化数据增长快10倍到50倍 •是传统数据仓库的10倍到50倍 大数据的异构和多样性 • 很多不同形式(文本、图像、视频、机器数据) • 无模式或者模式不明显 • 不连贯的语法或句义 • 大量的不相关信息 • 对未来趋势与模式的可预测分析 • 深度复杂分析(机器学习、人工智能Vs传统商务 智能(咨询、报告等) 实时分析而非批量式分析 • 数据输入、处理与丢弃 • 立竿见影而非事后见效 大数据的4V特征 “大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是 “大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据
alme价值 挖掘大数据的价值类似沙里淘金从海量数据中挖掘稀疏但珍贵的信息 值密度低是大数据的一个典型特征 为了一底金子,需要保存全鄣沙子
Value 价值 • 挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息. • 价值密度低,是大数据的一个典型特征
面向信息化战争的文化转盟 海 垂 售是屋 具打镁方打胜幞 依活为军从严军重在治官边权 COMPANY LOGOTYPE INSERT