降维分析与分类分析的概念 >2、实现分类分析的三种技术 ◆(2)判别分析 判别分析的概念 判别分析的过程是基于已有数据集制作分类规则的过程。 即系统接受用户提供的已有类别(基于某一变量取值分类, 内部包含若干样本),然后寻找基于其他变量的判别规则, 构造判定函数,以便基于判定函数对未来个案自动分类的 过程。 判别分析过程实际上是系统主动探索与学习的过程(类似 于多元回归分析),然后依据已经习得的规则,对其他个 案进行判定其归属类别
一、降维分析与分类分析的概念 ➢ 2、实现分类分析的三种技术 ◆(2)判别分析 判别分析的概念 判别分析的过程是基于已有数据集制作分类规则的过程。 即系统接受用户提供的已有类别(基于某一变量取值分类, 内部包含若干样本),然后寻找基于其他变量的判别规则, 构造判定函数,以便基于判定函数对未来个案自动分类的 过程。 判别分析过程实际上是系统主动探索与学习的过程(类似 于多元回归分析),然后依据已经习得的规则,对其他个 案进行判定其归属类别。 7
降维分析与分类分析的概念 >2、实现分类分析的三种技术 判别分析的示例 基本要求 ˇ某校收集了学生的很多项信息。其中有一条是“是否三 好学生”。现在需要找到一个判别函数,能够从学习成 绩、承担班级事务、参与社会活动、热心帮助其他同学 等维度来实现为尚未分类的学生自动分类的过程 基本思路 先根据已有的个案,把“是否三好学生”作为因变量 把“学习成绩、承担班级事务、参与社会活动、热心帮 助其他同学”作为自变量,让系统根据这些数据进行归 纳,最终构造出判定函数。 对于新同学,只需输入作为自变量的几个属性值,由系 统根据判定函数做出判定,找出检验概率值最大的类别, 作为最终类别
一、降维分析与分类分析的概念 8 ➢ 2、实现分类分析的三种技术 判别分析的示例 基本要求 ✓某校收集了学生的很多项信息。其中有一条是“是否三 好学生”。现在需要找到一个判别函数,能够从学习成 绩、承担班级事务、参与社会活动、热心帮助其他同学 等维度来实现为尚未分类的学生自动分类的过程。 基本思路 ✓先根据已有的个案,把“是否三好学生”作为因变量, 把“学习成绩、承担班级事务、参与社会活动、热心帮 助其他同学”作为自变量,让系统根据这些数据进行归 纳,最终构造出判定函数。 ✓对于新同学,只需输入作为自变量的几个属性值,由系 统根据判定函数做出判定,找出检验概率值最大的类别, 作为最终类别
、层次聚类分析 >1、层次聚类分析的概念 ◆(1)什么是层次聚类? SPS中的系统聚类,也叫层次聚类、分层聚类 。采用逐层、逐级聚类模式 。先把距离最近的若干元素归类,形成新元素点 再从新元素点中挑选距离最近的元素进一步聚类 直到所有元素都被聚集为同一类。 ◆(2)层次聚类的特点 是一种没有预设条件的聚类模式, 逐层、逐级聚类 最终所有元素聚集为一类
二、层次聚类分析 ➢ 1、层次聚类分析的概念 ◆(1)什么是层次聚类? SPSS中的系统聚类,也叫层次聚类、分层聚类。 采用逐层、逐级聚类模式 先把距离最近的若干元素归类,形成新元素点 再从新元素点中挑选距离最近的元素进一步聚类 直到所有元素都被聚集为同一类。 ◆(2)层次聚类的特点 是一种没有预设条件的聚类模式, 逐层、逐级聚类 最终所有元素聚集为一类。 9
、层次聚类分析 >2、层次聚类分析的类型 ◆Q聚类 是针对个案的聚类,目的是把个案按照距离关系逐级聚类 与生活中的分类思想完全一致 本质上是一种行聚类,把每行的数据作为一个处理元素 基本思路: 先计算不同元素(行数据)之间的距离, 每次选择距离最近的元素,把它们聚为一类
二、层次聚类分析 ➢ 2、层次聚类分析的类型 ◆Q聚类 是针对个案的聚类,目的是把个案按照距离关系逐级聚类。 与生活中的分类思想完全一致。 本质上是一种行聚类,把每行的数据作为一个处理元素。 基本思路: 先计算不同元素(行数据)之间的距离, 每次选择距离最近的元素,把它们聚为一类。 10
、层次聚类分析 ◆R聚类 。是针对变量的聚类,目的是把变量按照距离关系逐级聚类。 减少变量的数量,实现降维的目标 本质上是一种列聚类,把每列的数据作为一个处理元素 基本思路: 先计算不同元素(列数据)之间的距离, 每次选择距离最近的元素,把它们聚为一类。 最终,通过观察聚类结果,体会各个变量之间的逻辑关系
二、层次聚类分析 11 ◆R聚类 是针对变量的聚类,目的是把变量按照距离关系逐级聚类。 减少变量的数量,实现降维的目标。 本质上是一种列聚类,把每列的数据作为一个处理元素。 基本思路: 先计算不同元素(列数据)之间的距离, 每次选择距离最近的元素,把它们聚为一类。 最终,通过观察聚类结果,体会各个变量之间的逻辑关系