大数据的魅力 大数据 大数据,或称海量数据, 指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 例如:Google每天有来自全球30亿条搜索指令 每天都有成千上万的人通过Google搜索信息, 从出游的路线和耗时、治疗某种疾病的方法和某 研究方向的最新学术资料,各式各样的搜索要求 都有 ·这样的搜索引擎无疑极大地方便了人们的生活 和工作
• 大数据 – 大数据,或称海量数据,指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 – 例如: Google每天有来自全球30亿条搜索指令 • 每天都有成千上万的人通过Google搜索信息, 从出游的路线和耗时、治疗某种疾病的方法和某 研究方向的最新学术资料,各式各样的搜索要求 都有 • 这样的搜索引擎无疑极大地方便了人们的生活 和工作 大数据的魅力 7
大数据的魅力 大数据 大数据,或称海量数据, 指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 -这一系列搜索数据从侧面显示出搜索这些信息的 人的本身情况,比如他们的想法、需求、忧虑等 非常有价值的信息 如果这些搜索数据能准确地反映人们的生活和工 作状况,那么就有可能利用这些信息来察觉商业 趋势、避免疾病扩散、打击犯罪、测定实时交通 路况和预测选举结果等
• 大数据 – 大数据,或称海量数据,指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 – 这一系列搜索数据从侧面显示出搜索这些信息的 人的本身情况,比如他们的想法、需求、忧虑等 非常有价值的信息 – 如果这些搜索数据能准确地反映人们的生活和工 作状况,那么就有可能利用这些信息来察觉商业 趋势、避免疾病扩散、打击犯罪、测定实时交通 路况和预测选举结果等 大数据的魅力 8
大数据的魅力 大数据 大数据,或称海量数据, 指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 与小数据集的比较: 在总数据量相同的情况下,与个别分析独立的 小型数据集相比,将各个小型数据集合并后进行 大数据分析可得出许多额外的信息和数据关联性 这正是大型数据集盛行的原因 数据挖掘则是探讨用以解析大数据的方法
• 大数据 – 大数据,或称海量数据,指所涉及的数据量规模 巨大到无法通过人工,在合理时间内达到截取、 管理、处理、并整理成为人类所能解读的信息 – 与小数据集的比较: 在总数据量相同的情况下,与个别分析独立的 小型数据集相比,将各个小型数据集合并后进行 大数据分析可得出许多额外的信息和数据关联性 – 这正是大型数据集盛行的原因 – 数据挖掘则是探讨用以解析大数据的方法 大数据的魅力 9
大数据的魅力 大数据案例一谷歌预测冬季流感的传播 2008年11月谷歌启动“谷歌流感趋势”(Google Flu Trends,GFT)项目 GFT项目把5000万个美国人最频繁检索的词项与 美国疾病预防控制中心告知的2003年~2008年季 节性流感传播期间的数据进行比较,以确定相关 检索词项 为测试这些检索词项的使用频率与流感在时间和 空间上传播之间的联系,GFT共处理了4.5亿个不 同的数学模型
• 大数据案例—谷歌预测冬季流感的传播 – 2008年11月谷歌启动“谷歌流感趋势”(Google Flu Trends, GFT) 项目 – GFT项目把5000万个美国人最频繁检索的词项与 美国疾病预防控制中心告知的2003年~2008年季 节性流感传播期间的数据进行比较,以确定相关 检索词项 – 为测试这些检索词项的使用频率与流感在时间和 空间上传播之间的联系,GFT共处理了4.5亿个不 同的数学模型 大数据的魅力 10
大数据的魅力 大数据案例一谷歌预测冬季流感的传播 为测试这些检索词项的使用频率与流感在时间和 空间上传播之间的联系,GT共处理了4.5亿个不 同的数学模型 在把得出的预测与2007年和2008年疾病预防控制 中心记录的实际流感病例进行对比后,GFT的软 件发现了45个检索词项的组合 把这些检索词项用于一个特定的数学模型后,其 预测与官方数据相关性高达97%
• 大数据案例—谷歌预测冬季流感的传播 – 为测试这些检索词项的使用频率与流感在时间和 空间上传播之间的联系,GFT共处理了4.5亿个不 同的数学模型 – 在把得出的预测与2007年和2008年疾病预防控制 中心记录的实际流感病例进行对比后,GFT的软 件发现了45个检索词项的组合 – 把这些检索词项用于一个特定的数学模型后,其 预测与官方数据相关性高达97% 大数据的魅力 11