机器学习与智能金融第三章关联实现推荐关联分析与协同过滤
机器学习与智能金融 第三章 关联实现推荐 关联分析与协同过滤
本讲主要内容关联规则分析与算法原理编程实现与案例三关联规则在推荐系统中的应用
本讲主要内容 一 关联规则分析与算法原理 二 编程实现与案例 三 关联规则在推荐系统中的应用
关联规则分析关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。典型例子:购物篮分析,寻找出频繁出现在一起的组合。作为个性化推荐的依据!金融领域引申·银行客户端的理财推荐系统分析优秀基金经理频繁购买的金融产品组合,是否是跑赢大盘的有效组合?
关联规则分析 关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查 找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。 • 购物篮分析,寻找出频繁出现在一起的组合。作为个性化推荐的依据! • 金融领域引申 ◈银行客户端的理财推荐系统 ◈分析优秀基金经理频繁购买的金融产品组合,是否是跑赢大盘的有效组合? 典型例子:
Apriori算法的输入输出一组人的交易清单。每一笔交易(Transaction)包含一系列的商品(Items)根据该交易清单寻找哪些商品经常一起出现,即关联规则(Rules)
一组人的交易清单。 每一笔交易(Transaction)包含一系列的商品(Items)。 根据该交易清单寻找哪些商品经常一起出现,即关联规则(Rules)。 Apriori 算法的输入输出
Apriori算法基本概念项集:包含0个或多个项的集合被称为项集(ItemSet)·如果一个项集包含k个项,则称它为k-项集。例如啤酒,尿布,牛奶,花生}是一个4-项集。空集是指不包含任何项的项集。超集/子集项集A二项集B,则A是B的子集,B是A的超集。频繁项集:在整个交易清单中,包含该项集的条目(占总条目的比例超过某一阈值的项集
Apriori 算法基本概念 项集:包含0个或多个项的集合被称为项集(ItemSet)。 • 如果一个项集包含k个项,则称它为k-项集。例如{啤酒,尿布,牛奶,花生} 是一个4-项集。空集是指不包含任何项的项集。 超集/子集 • 项集A⊆项集B,则A是B的子集,B是A的超集。 频繁项集:在整个交易清单中,包含该项集的条目(占总条目的比例) 超过某一阈值的项集