2.1 数据类型. 2 2.1.1 离散型数据.2 2.1.2 连续型数据.2 2.2 数据预处理. 2 2.2.1 数据预处理的原因.2 2.2.2 数据预处理的主要步骤.3 2.3 数据清理. 5 2.3.1 空缺值.5 2.3.2 噪声数据.5 2.4 数据集成. 7 2.4.1 实体识别问题.7 2.4.2 数据冗余.7 2.4.3 元组重复.8 2.5 数据归约. 8 2.5.1 数据立方体聚集.9 2.5.2 维归约.10 2.5.3 数量归约.11 2.5.4 数据压缩.12 2.6 数据变换. 12 2.6.1 数据规范化.12 2.6.2 数据离散化与概念分层.13 2.7 数据预处理的软件操作(SPSS Modeler). 16 2.7.1 数据类型.16 2.7.2 数据清理.17 (1)缺失值与无效值.17 (2)孤立值和极值.22 2.7.3 数据集成.25 (1)纵向追加.25 (2)横向合并.26 (3)元组重复.28 2.7.4 数据归约.29 (1)抽样.29 (2)分箱.32 (3)特征选择.36 (4)因子分析.37 2.7.5 数据变换.40
文件格式: PDF大小: 496.04KB页数: 6
1.1 什么是数据挖掘. 2 1.2 数据挖掘的步骤. 2 1.3 数据挖掘的主要功能. 4 1.3.1 预测性.4 1.3.2 描述性.5 1.4 在何种数据上进行数据挖掘. 7 1.4.1 数据库数据.7 1.4.2 数据仓库.8 1.4.3 事务数据.8 1.5 数据挖掘的工具. 8 1.6 数据挖掘研究的主要方向. 9 1.6.1 数据挖掘的方法.9 1.6.2 用户交互技术.9 1.6.3 数据挖掘的性能和可扩展性.9 1.6.4 针对不同数据或数据源的数据挖掘技术 .9 1.7 数据挖掘的应用领域. 10 1.8 SPSS Modeler 软件使用概述. 10 1.8.1 软件简介.10 1.8.2 软件窗口.12 1.8.3 数据流的基本操作.13
文件格式: PDF大小: 831.52KB页数: 8
浙江大学:《单细胞组学》课程教学课件(讲稿)单细胞其他组学数据分析(3/3)空间转录组、表观组
文件格式: PDF大小: 9.34MB页数: 50
浙江大学:《单细胞组学》课程教学课件(讲稿)单细胞转录组数据分析(2/3)基于细胞类型的高级分析
文件格式: PDF大小: 6.01MB页数: 57
浙江大学:《单细胞组学》课程教学课件(讲稿)单细胞转录组数据分析(1/3)从原始数据到细胞类型注释
文件格式: PDF大小: 7.8MB页数: 60
浙江大学:《单细胞组学》课程教学课件(讲稿)单细胞分离分选;单细胞悬制备、扩增和测序技术(2/2)
文件格式: PDF大小: 4.48MB页数: 34
1.单细胞测序 2.单细胞悬液制备 3.单细胞分离技术 4.单细胞扩增和测序技术 5.空间组学测序技术
文件格式: PDF大小: 8.21MB页数: 72
浙江大学:《单细胞组学》课程教学课件(讲稿)绪论 Single-Cell Omics
文件格式: PDF大小: 3.83MB页数: 57










