概念描述:特征化与比较
概念描述:特征化与比较
两种不同类别的数据挖掘 从数据分析的角度看,数据挖掘可以分为描述 性挖掘和预测性挖掘 ¤描述性挖掘:以简洁概要的方式描述薮据,并提供 数据的有趣的一般性质 ¤预测性数据挖掘:通过分析数据建立一个或一组模 型,并试图预测新数据集的行为
两种不同类别的数据挖掘 ◼ 从数据分析的角度看,数据挖掘可以分为描述 性挖掘和预测性挖掘 ❑ 描述性挖掘:以简洁概要的方式描述数据,并提供 数据的有趣的一般性质。 ❑ 预测性数据挖掘:通过分析数据建立一个或一组模 型,并试图预测新数据集的行为
什么是概念描述? ■概念描述是一种最简单的描述性挖掘 口当所描述的概念所指的是一类对象时,也称为类描 述 概念指的是一类数据的集合 口eg研究生,大客户 概念描述是指为数据的特征化和比较产生描述 特征化:提供给定数据集的简洁汇总。 区分:提供两个或多个数据集的比较描述
什么是概念描述? ◼ 概念描述是一种最简单的描述性挖掘 ❑ 当所描述的概念所指的是一类对象时,也称为类描 述 ◼ 概念指的是一类数据的集合 ❑ e.g. 研究生,大客户 ◼ 概念描述是指为数据的特征化和比较产生描述 ❑ 特征化:提供给定数据集的简洁汇总。 ❑ 区分:提供两个或多个数据集的比较描述
概念描述VS.OLAP ■概念描述和数据仓库的联机分析处理(OLAP)都跟 数据概化密切相关,即以简洁的形式在更一般的抽象 层描述数据,允许数据在抽象层概化,便于考察数据 的一般 ■两者的主要区别 口概念描述 可以处理复杂数据类型的属性及其聚集 个更加自动化的过程 D OLAP 实际使用的OLAP系统中,维和度量的数据类型都非常有限 (非数值型的维和数值型的数据),表现为一种简单的数据分 析模型 个由用户控制的过程
概念描述 VS. OLAP ◼ 概念描述和数据仓库的联机分析处理(OLAP)都跟 数据概化密切相关,即以简洁的形式在更一般的抽象 层描述数据,允许数据在抽象层概化,便于考察数据 的一般行为。 ◼ 两者的主要区别: ❑ 概念描述 ◼ 可以处理复杂数据类型的属性及其聚集 ◼ 一个更加自动化的过程 ❑ OLAP ◼ 实际使用的OLAP系统中,维和度量的数据类型都非常有限 (非数值型的维和数值型的数据),表现为一种简单的数据分 析模型 ◼ 一个由用户控制的过程
数据概化 ■数据概化 ¤数据库中的数据和对象通常包含原始概念层的细节信息,数 据概化就是将数据库中的跟任务相关的数据集从较低的概念 层抽象到较高的概念层的过程。 345 概念层 主要方法: a数据立方体(OLAP使用的方法) a面向属性的归纳方法
数据概化 ◼ 数据概化 ❑ 数据库中的数据和对象通常包含原始概念层的细节信息,数 据概化就是将数据库中的跟任务相关的数据集从较低的概念 层抽象到较高的概念层的过程。 ◼ 主要方法: ❑ 数据立方体(OLAP使用的方法) ❑ 面向属性的归纳方法 1 2 3 4 5 概念层