第7章图计算
第7章 图计算
提纲 7.1图计算简介 7.2 Prege简介 7.3 Prege图计算模型 74 Pregel的c++AP 75 Pregel的体系结构 7.6 Prege的应用实例 77 Pregel和 MapReduce实现 PageRank算法的对比 7.8Hama的安装和使用
提纲 • 7.1 图计算简介 • 7.2 Pregel简介 • 7.3 Pregel图计算模型 • 7.4 Pregel的C++ API • 7.5 Pregel的体系结构 • 7.6 Pregel的应用实例 • 7.7 Pregel和MapReduce实现PageRank算法的对比 • 7.8 Hama的安装和使用
7.1图计算简介 ·7.1.1图结构数据 7.1.2传统图计算解决方案的不足之处 7.1.3图计算通用软件
7.1 图计算简介 • 7.1.1 图结构数据 • 7.1.2 传统图计算解决方案的不足之处 • 7.1.3 图计算通用软件
7.1.1图结构数据 许多大薮据都是以大规模图或网络的形式呈现,如社交网 络、传染病传播途径、交通事故对路网的影响 ·许多非图结构的大数据,也常常会被转换为图模型后进行 分析 ·图数据结构很好地表达了数据之间的关联性 ·关联性计算是大数据计算的核心——通过获得数据的关联 性,可以从噪音很多的海量数据中抽取有用的信息 比如,通过为购物者之间的关系建模,就能很快找到口 味相似的用户,并为之推荐商品 或者在社交网络中,通过传播关系发现意见领袖
•许多大数据都是以大规模图或网络的形式呈现,如社交网 络、传染病传播途径、交通事故对路网的影响 •许多非图结构的大数据,也常常会被转换为图模型后进行 分析 •图数据结构很好地表达了数据之间的关联性 •关联性计算是大数据计算的核心——通过获得数据的关联 性,可以从噪音很多的海量数据中抽取有用的信息 –比如,通过为购物者之间的关系建模,就能很快找到口 味相似的用户,并为之推荐商品 –或者在社交网络中,通过传播关系发现意见领袖 7.1.1 图结构数据
7.1.2传统图计算解决方案的不足之处 很多传统的图计算算法都存在以下几个典型问题: (1)常常表现出比较差的内存访问局部性 (2)针对单个顶点的处理工作过少 (3)计算过程中伴随着并行度的改变
7.1.2传统图计算解决方案的不足之处 很多传统的图计算算法都存在以下几个典型问题: (1)常常表现出比较差的内存访问局部性 (2)针对单个顶点的处理工作过少 (3)计算过程中伴随着并行度的改变