概念分层—上卷和下钻 在概念分层中应用上卷操作(概化),使得用户可以 使用较高层次概念替代较低层次概念 口可以在更有意义,更高、更抽象的层次观察数据,从而使发 现的模式更加容易理解 上卷操作使得数据得到压缩,在这个压缩的数据集上进行挖 掘可以减少O操作,使得挖掘的效率提高 概念分层的下钻操作使用较低层概念代贊较高层概念, 苁而使角芦能够对过子一般化的数据做更详细分析 上眷和下钻操作让用户以不同视图观察数据,洞察隐 藏的数据联系。 概念分层的自动生成。 在同一个维上,可能根据用户的观点不同,存在多个 既念分层
概念分层 ——上卷和下钻 ◼ 在概念分层中应用上卷操作(概化),使得用户可以 使用较高层次概念替代较低层次概念 ❑ 可以在更有意义,更高、更抽象的层次观察数据,从而使发 现的模式更加容易理解。 ❑ 上卷操作使得数据得到压缩,在这个压缩的数据集上进行挖 掘可以减少I/O操作,使得挖掘的效率提高。 ◼ 概念分层的下钻操作使用较低层概念代替较高层概念, 从而使用户能够对过于一般化的数据做更详细分析。 ◼ 上卷和下钻操作让用户以不同视图观察数据,洞察隐 藏的数据联系。 ◼ 概念分层的自动生成。 ◼ 在同一个维上,可能根据用户的观点不同,存在多个 概念分层
概念分层的类型 ■四种常用的概念分层类型 口模式分层 E.g., street city province country a集合分组分层 E.g., 120-39)=young, (40-59= middle_aged 口操作导出的分层 Email:abc@cs.zju.edu.cn 口基于规则的分层 low_profit_ margin()<= price(X, P1)and cost (X, P2) and (P1-P2)<$50 high _profit margin (X)<= price(X, P1)and cost(X, P2 )and (P1-P2)>$250
概念分层的类型 ◼ 四种常用的概念分层类型 ❑ 模式分层 ◼ E.g., street < city < province < country ❑ 集合分组分层 ◼ E.g., {20-39} = young, {40-59} = middle_aged ❑ 操作导出的分层 ◼ Email:abc@cs.zju.edu.cn ❑ 基于规则的分层 ◼ low_profit_margin (X) <= price(X, P1) and cost (X, P2) and (P1 - P2) < $50 ◼ high_profit_margin (X) <= price(X, P1) and cost (X, P2) and (P1 - P2) > $250