数据挖掘 籐少华 广东工业大学 协同计算与知识工程
数据挖掘 滕少华 广东工业大学 协同计算与知识工程
案例四:移动业务关联规则挖掘 >概述 移动运营商提供多种适合不同客户需求的业务。客户 通常会使用一种或多种业务,这些业务之间可能存在 些有趣的潜在关系。关联规则技术可以挖掘现有客 户同时会使用什么业务,哪些业务的使用会带动新的 业务的使用,以应用于业务交叉销售。通过交叉销售 使运营商能够以较低的营销成本建立和扩展与客户的 关系、为客户提供所需的感兴趣的业务或某一特定业 务的升级或附加业务,使客户利益和价值最大化
案例四:移动业务关联规则挖掘 ➢ 概述 ◼ 移动运营商提供多种适合不同客户需求的业务。客户 通常会使用一种或多种业务,这些业务之间可能存在 一些有趣的潜在关系。关联规则技术可以挖掘现有客 户同时会使用什么业务,哪些业务的使用会带动新的 业务的使用,以应用于业务交叉销售。通过交叉销售, 使运营商能够以较低的营销成本建立和扩展与客户的 关系、为客户提供所需的感兴趣的业务或某一特定业 务的升级或附加业务,使客户利益和价值最大化
数据准备 进作业务关联规则分 字段顺 字段名 字段名称 析害要收集客户使用 序 业的撇据。本案例 Usr nbr 手机号码 使用某移动公司一个 Fetion flag 飞信 月的客户新业务使用 23456789 mms flag 彩信 数据,包括18种业务 mormal flag 139邮箱 fla 号薄管家 每种业务的值为1表 smsrtn flag 短信回执 示开通,为0表示为 gprs pkg GRPS 开通将客户手机卡号, mobnews flag 手机报 将其作为客户ID,如 timeness flag 新闻早晚报 表7-12。 10 flag 彩铃 11 wireless adv usr flag无线音乐高级会员 12 wireless mus flag 无线音乐俱乐部 ag 铃音盒 14 quang down 全曲下载 15 hotel preord call flag 酒店预定 16 aer preord flag 机票预定 17 mo call 12580 flag 百科业务 18 bpay fl 手机支付 19 mobgame flag 手机游戏 7-12客戶新业务便用表
数据准备 ◼ 进行业务关联规则分 析需要收集客户使用 业务的数据。本案例 使用某移动公司一个 月的客户新业务使用 数据,包括18种业务, 每种业务的值为1表 示开通,为0表示为 开通将客户手机卡号, 将其作为客户ID,如 表7-12。 表7-12 客户新业务使用表 字段顺 序 字段名 字段名称 1 Usr_nbr 手机号码 2 Fetion_flag 飞信 3 mms_flag 彩信 4 mobmail_flag 139邮箱 5 pim_flag 号薄管家 6 smsrtn_flag 短信回执 7 gprs_pkg GRPS 8 mobnews_flag 手机报 9 timenews_flag 新闻早晚报 10 cr_flag 彩铃 11 wireless_adv_usr_flag 无线音乐高级会员 12 wireless_mus_flag 无线音乐俱乐部 13 cr_box_flag 铃音盒 14 quanqu_down 全曲下载 15 hotel_preord_call_flag 酒店预定 16 aer_preord_flag 机票预定 17 mo_call_12580_flag 百科业务 18 mobpay_flag 手机支付 19 mobgame_flag 手机游戏
关联规则挖掘过程-1 本案例使用 SAS EM的关联规则节点进行业务关联分析。分析之前必须 用数据输入节点指定预处理后的数据集,每种业务代表一个项。由于数 据量不大故不进行抽样,流程图如图7-29: 图7-29关联规则挖掘流程图 由于本案例的数据没有关于时间的信息,所以分析模式选择‘关联模 式’。本案例使用经典的 Apro算法挖掘出所有的规则。最小支持 度和最小置信度是关联规则最主要的两个评价指标。这里以神舟行客 户的数据为例进行参数设置说明,鉴于电信行业多数新业务的使用率 都比较小,可设定项的最小比例和最小规则置信度分别为5%和50%, 如图7-30所示
关联规则挖掘过程-1 ➢ 规则的生成 ◼ 本案例使用SAS EM的关联规则节点进行业务关联分析。分析之前必须 用数据输入节点指定预处理后的数据集,每种业务代表一个项。由于数 据量不大故不进行抽样,流程图如图7-29: 图 7-29 关联规则挖掘流程图 ◼ 由于本案例的数据没有关于时间的信息,所以分析模式选择‘关联模 式’。 本案例使用经典的Apriori算法挖掘出所有的规则。最小支持 度和最小置信度是关联规则最主要的两个评价指标。这里以神舟行客 户的数据为例进行参数设置说明,鉴于电信行业多数新业务的使用率 都比较小,可设定项的最小比例和最小规则置信度分别为5%和50%, 如图7-30所示
关联规则挖掘过程-2 Data I Variables General ctr. 1 Ii as Cest i. s I Sort Output 1 Analysis mode: O By Context Associat ion O Sequences Minimum Transact ion Frequency to Support Assoc i 05% of largest single item frequency O Specify a count . centage: O Specify as a pe 「5.00 Maximum number of items in an associat ion: 18 Minimum conf idence for rule generat ion 「50X 图7-30关联规则参数设置 规则的选取
关联规则挖掘过程-2 图 7-30 关联规则参数设置 ➢规则的选取