2010年海地地震,海地人散落在全国各地,援助人员为 弄清该去哪里援助手忙脚乱。传统上,他们只能通过飞往 灾区上空来查找需要援助的人群。 些硏究人员宋取了一种不同的做法:他们开始跟踪 海地人所持手机内部的SM卡,由此判断出手机持有人所 处的位置和行动方向。正如一份联合国(UN)报告所泷,此 举帮助他们“准确地分析出了逊60万名海地人逃离太子港 之后的目的地。"后来,当海地爆发瞿乱疫情时,同一批 研究人员再次通过追踪SM卡把药品投放到正确的地点 阻止了疫情的蔓延 COMPANY LOGOTYPE INSERT
• 2010年海地地震,海地人散落在全国各地,援助人员为 弄清该去哪里援助手忙脚乱。传统上,他们只能通过飞往 灾区上空来查找需要援助的人群。 • 一些研究人员采取了一种不同的做法:他们开始跟踪 海地人所持手机内部的SIM卡,由此判断出手机持有人所 处的位置和行动方向。正如一份联合国(UN)报告所述,此 举帮助他们“准确地分析出了逾60万名海地人逃离太子港 之后的目的地。”后来,当海地爆发霍乱疫情时,同一批 研究人员再次通过追踪SIM卡把药品投放到正确的地点, 阻止了疫情的蔓延
ariety多样性 企业内部的经营交易信息;物联网世界中商品,物流信息;互联 网世界中人与人交互信息,位置信息等是大数据的主要来源 文本/图片/视频等非结构化/芈结构化数据 能够在不同的数据类型中,进行交叉分析的技术,是大数据的 心技术之一语义分析技术,图文转换技术,模式识别技术,地 理信息技术等,都会在大数据分析时获得应用 日交 博客 COMPANY LOGOTYPE INSERT
Variety 多样性 •企业内部的经营交易信息;物联网世界中商品,物流信息;互联 网世界中人与人交互信息,位置信息等是大数据的主要来源. •文本/图片/视频 等非结构化/半结构化数据 •能够在不同的数据类型中,进行交叉分析的技术,是大数据的 核心技术之一.语义分析技术,图文转换技术,模式识别技术,地 理信息技术等,都会在大数据分析时获得应用
非结构化数据 多体 非结构化文档数据 相对于结构化数据而,不方便用数据库二维逻辑表来表现的 数据即称为排结构化数据,包括所有格式的办公文档、文本 图片、ⅩML、HTML、各类报表、图像和音频/视频信息等等 回理经济学例分析 原u最酷榜 批比, 萌猫火眼金睛堪比魔术 012管理经济学课程论文 节目原创精选2013 14:23龙凤恒通69 359.00 理写清学是一门究阳问儒物方双性学理万地金 性二,它与工业结学,回鸦经学,世量结存学、1 投诉卖家(含免话费:000 申请售后 口订单 静一,把理论空用于某一杜母,图吗经一个 变,国于社结 气产业作为国结者要分,其状豆来出胜 w保障卡 额色分类 里轴 器泥 COMPANY LOGOTYPE INSERT
非结构化数据 相对于结构化数据而言,不方便用数据库二维逻辑表来表现的 数据即称为非结构化数据,包括所有格式的办公文档、文本、 图片、XML、HTML、各类报表、图像和音频/视频信息等等
elocity速度 1s是临界点 对于大数据应用而言,必须要在1秒钟内形成答案,否则处理 结果就是过时和无效的 实时处理的要求,是区别大数据引用和传统数据仓库技术, B技术的关键差别之 COMPANY LOGOTYPE INSERT
Velocity 速度 • 1s 是临界点. • 对于大数据应用而言,必须要在1秒钟内形成答案,否则处理 结果就是过时和无效的. • 实时处理的要求,是区别大数据引用和传统数据仓库技术, BI技术的关键差别之一
olume数据量 P大据次的临界点.KB->MB->GB->TB->PB->EB->ZB->YB>NB ->DB 更大的数据集(例如,PB级规模) 更多的智能算法 数据库最大容量 描述/OLAP多维数据集 TB 用来描述数据通过交叉表的可视 1.000 化/聚合在不同的粒度级别 750 500 250 0 1998"00020406082010 我们正在步入信息革命时代,这个时代的绝大 部分数据由软件日志,照相机,麦克风,RF|D 阅读器,无线传感器网络等机器标记。这些机器 产生的数据的速度远远超过人们现有的处理能力 推理机器学习: 因为他们的数据产生速度遵循摩尔定律。” 通过对比数据不断的调整模型和 Professor Joseph Hellerstein 参数,计算可行性分析来直接捕 捉人口的基本属性
Volume 数据量 PB是大数据層次的临界点. KB->MB->GB->TB->PB->EB->ZB->YB->NB ->DB