问题定义 序列α在序列数据库S中的支持度为序列数据库 S中包含序列的序列个数,记为 Support(ax) 给定支持度阈值ξ,如果序列α在序列数据库中 的支持数不低于ξ,则称序列α为序列模式 长度为-序列模式记为-模式 2021/8/25
2021/8/25 11 问题定义 ▪ 序列在序列数据库S中的支持度为序列数据库 S中包含序列的序列个数,记为Support() ▪ 给定支持度阈值,如果序列在序列数据库中 的支持数不低于,则称序列为序列模式 ▪ 长度为l的序列模式记为l-模式
例子:设序列数据库如下图所示,并设用户指定的最 小支持度 min-support=2。 Sid Sequence 10 <a(abc (ac)d(cf)> 20 <(ad)c(bc(ae)> 30 <(ef(ab)(fcb> 40 (afcc> ●序列<a(bc)df是序列< a(abc)(ac)d(cf的子序列 ●序列<(ab)c>是长度为3的序列模式 2021/8/25
2021/8/25 12 ◼ 例子:设序列数据库如下图所示,并设用户指定的最 小支持度min-support = 2。 Sid Sequence 10 <a(abc)(ac)d(cf)> 20 <(ad)c(bc)(ae)> 30 <(ef)(ab)(df)cb> 40 <(af)cbc> ⚫ 序列<a(bc)df>是序列<a(abc)(ac)d(cf)>的子序列 ⚫ 序列<(ab)c>是长度为3的序列模式
序列模式VS关联规则 问题 序列模式挖掘关联规则挖掘 数据集 序列数据库事务数据库 关注点 单项间在同一单项间在同一 事务内以及事事务内的关系 务间的关系 2021/8/25 13
2021/8/25 13 序列模式 VS 关联规则 问题 序列模式挖掘 关联规则挖掘 数据集 序列数据库 事务数据库 关注点 单项间在同一 事务内以及事 务间的关系 单项间在同一 事务内的关系
序列模式挖掘的应用背景 应用领域 客户购买行为模式预测 Web访问模式预测 疾病诊断 自然灾害预测 DNA序列分析 2021/8/25 14
2021/8/25 14 二、序列模式挖掘的应用背景 ◼ 应用领域: ▪ 客户购买行为模式预测 ▪ Web访问模式预测 ▪ 疾病诊断 ▪ 自然灾害预测 ▪ DNA序列分析
应用案例1:客户购买行为模式 分析 ■B2C电子商务网站可以根据客户购买纪录来分析客 户购买行为模式,从而进行有针对性的营销策略。 ID User transaction sequence 1234 图书交易网站将用户购 物纪录整合成用户购物 序列集 相关商品推荐:如果用 得到用户<CUML语 户购买了书籍“UML语 购物行为言”)~Vsio2003实用 言”,则推荐 序列模式技巧”)> Visio2003实用技巧 2021/8/25 15
2021/8/25 15 应用案例1:客户购买行为模式 分析 ◼ B2C电子商务网站可以根据客户购买纪录来分析客 户购买行为模式,从而进行有针对性的营销策略。 ID User transaction sequence 1 ………………………………………… ……………….. 2 ………………………………………… …… 3 ………………………………………… ………….. 4 …………………………………. 图书交易网站将用户购 物纪录整合成用户购物 序列集合 得到用户 购物行为 序列模式 <(“UML语 言”)(“Visio2003实用 技巧”)> 相关商品推荐:如果用 户购买了书籍“UML语 言”, 则推荐 “Visio2003实用技巧