《分布式统计方法》课程教学大纲 一、课程基本信息 课程代码:18100083 课程名称:分布式统计方法 英文名称:Distributed Statistical Methods 课程类别:专业课 时:48 学 分:3 适用对象:数据科学与大数据技术专业大四学生 考核方式:考试 先修课程:概率论,数理统计,线性代数,机器学习 二、课程简介 中文简介 本课程介绍与分布式统计问题相关的各种算法,包括各种分类、回归、聚类算法,最速下降 法、牛顿法、拟牛顿法、BFGS算法等等。 英文简介 This our introducesdifferent types of algorithms related to distributed statistical problems including classification,regression,clustering.steepest descent method,Newton's method,quasi Newton method,BFGS methods ete 三、课程性质与教学目的 本课程是面向大四大数据专业学生开设的专业选修课,也可作为其他专业学生的选修课。课 程目的是介绍与分布式统计问题密切相关的各种算法,培养和增强学生解决实际数据分析问题的 能力。 课程思政总体思路:分布式统计方法包含很多统计学基本方法和最优化方法,如今广泛应用 于人工智能,运筹,物流,国防等领域。世界各国无不将最新的智能算法应用于生活、生产乃至 于战争中,以掌握主动权。当前世界局势纷繁复杂,如果我们能够应用好最新的各种与分布式统 计相关的算法,这将有助于我国在人工智能,国防等领域抢占先机,争夺话语权。 四、教学内容及要求 第一章人工智能简介、Apache Spark简介 (一)目的与要求
1 《分布式统计方法》课程教学大纲 一、课程基本信息 课程代码:18100083 课程名称: 分布式统计方法 英文名称:Distributed Statistical Methods 课程类别:专业课 学 时:48 学 分:3 适用对象:数据科学与大数据技术专业大四学生 考核方式:考试 先修课程:概率论,数理统计,线性代数,机器学习 二、课程简介 中文简介 本课程介绍与分布式统计问题相关的各种算法,包括各种分类、回归、聚类算法,最速下降 法、牛顿法、拟牛顿法、BFGS 算法等等。 英文简介 This course introduces different types of algorithms related to distributed statistical problems, including classification, regression, clustering, steepest descent method, Newton’s method, quasi Newton method, BFGS methods etc. 三、课程性质与教学目的 本课程是面向大四大数据专业学生开设的专业选修课,也可作为其他专业学生的选修课。课 程目的是介绍与分布式统计问题密切相关的各种算法,培养和增强学生解决实际数据分析问题的 能力。 课程思政总体思路:分布式统计方法包含很多统计学基本方法和最优化方法,如今广泛应用 于人工智能,运筹,物流,国防等领域。世界各国无不将最新的智能算法应用于生活、生产乃至 于战争中,以掌握主动权。当前世界局势纷繁复杂,如果我们能够应用好最新的各种与分布式统 计相关的算法,这将有助于我国在人工智能,国防等领域抢占先机,争夺话语权。 四、教学内容及要求 第一章 人工智能简介、Apache Spark 简介 (一)目的与要求
1.介绍人工智能的各种应用 2.介绍Apache Spark编程框架、软件和安装注意事项 (二)教学内容 第一节人工智能简介 1.主要内容 人工智能的应用领域 2,基本概念和知识点 机器学习,数据挖掘,模式识别 3.问题与应用(能力要求) 了解机器学习,数据挖掘,模式识别的区别与联系 第二节Apache Spark简介 1.主要内容 介绍Apache Spark软件的使用技巧,安装过程 2.基本概念和知识点 Apache Spark的环境配置 3.问题与应用(能力要求) 会安装Apache Spark软件,并学习Apache Spark的编程语言特点 (三)思考与实践 思考Apache Spark软件与R,python等软件的联系 (四)教学方法与手段 课堂讲授 第二章Breeze程序包 (一)目的与要求 1.介绍Breeze程序包的内容简装技巧 2.掌握Breeze程序包的基本命令和常用库 (二)教学内容 第一节创建向量、矩阵 1.主要内容 利用Breeze包创建向量、矩阵 2.基本概念和知识点 向量、矩阵 3.问题与应用(能力要求)》 掌握Breeze包创建向量、矩阵的技巧 第二节整行与整列的运算 1.主要内容 2
2 1.介绍人工智能的各种应用 2.介绍 Apache Spark 编程框架、软件和安装注意事项 (二)教学内容 第一节 人工智能简介 1.主要内容 人工智能的应用领域 2.基本概念和知识点 机器学习,数据挖掘,模式识别 3.问题与应用(能力要求) 了解机器学习,数据挖掘,模式识别的区别与联系 第二节 Apache Spark 简介 1.主要内容 介绍 Apache Spark 软件的使用技巧,安装过程 2.基本概念和知识点 Apache Spark 的环境配置 3.问题与应用(能力要求) 会安装 Apache Spark 软件,并学习 Apache Spark 的编程语言特点 (三)思考与实践 思考 Apache Spark 软件与 R,python 等软件的联系。 (四)教学方法与手段 课堂讲授 第二章 Breeze 程序包 (一)目的与要求 1.介绍 Breeze 程序包的内容简装技巧 2.掌握 Breeze 程序包的基本命令和常用库 (二)教学内容 第一节 创建向量、矩阵 1.主要内容 利用 Breeze 包创建向量、矩阵 2.基本概念和知识点 向量、矩阵 3.问题与应用(能力要求) 掌握 Breeze 包创建向量、矩阵的技巧 第二节 整行与整列的运算 1.主要内容
凸集,凸函数的定义及判别方法,闭包的含义 2.基本概念和知识点 Breeze包创建整行、整列 3.问题与应用(能力要求 掌握Breeze包创建整行、整列的技巧 第三节常用数学运算 1.主要内容 常见的spark软件包中的加减乘除运算 2.基本概念和知识点 数学中的各种运算 3.问题与应用(能力要求) 会用Breeze包创建各种基本数学运算 第四节常用分布 1.主要内容 Breeze包和各种分布的创 2.基本概念和知识点 正态分布、二项分布等等 3.问题与应用(能力要求) 会用Breeze包创建各种分布 (三)思考与实践 Breeze包中创建的各种分布的命令与R、Python软件的区别 (四)教学方法与手段 课堂讲授 第三章随机模拟和统计推断 (一)目的与要求 掌握随机数的产生方法和统计推断的技巧可 (二)教学内容 第一节随机数的产生 1.主要内容 用逆累积分布函数法、拒绝法产生随机数 2.基本概念和知识点 逆累积分布函数法、拒绝法 3.问题与应用(能力要求) 掌握逆累积分布函数法、拒绝法产生随机数 第二节W优化 3
3 凸集,凸函数的定义及判别方法,闭包的含义 2.基本概念和知识点 Breeze 包创建整行、整列 3.问题与应用(能力要求) 掌握 Breeze 包创建整行、整列的技巧 第三节 常用数学运算 1.主要内容 常见的 spark 软件包中的加减乘除运算 2.基本概念和知识点 数学中的各种运算 3.问题与应用(能力要求) 会用 Breeze 包创建各种基本数学运算 第四节 常用分布 1.主要内容 Breeze 包和各种分布的创建 2.基本概念和知识点 正态分布、二项分布等等 3.问题与应用(能力要求) 会用 Breeze 包创建各种分布。 (三)思考与实践 Breeze 包中创建的各种分布的命令与 R、Python 软件的区别 (四)教学方法与手段 课堂讲授 第三章 随机模拟和统计推断 (一)目的与要求 掌握随机数的产生方法和统计推断的技巧可 (二)教学内容 第一节 随机数的产生 1.主要内容 用逆累积分布函数法、拒绝法产生随机数 2.基本概念和知识点 逆累积分布函数法、拒绝法 3.问题与应用(能力要求) 掌握逆累积分布函数法、拒绝法产生随机数 第二节 EM 优化
1.主要内容 EM算法,收敛性分析 2.基本概念和知识点 EM算法 3.问题与应用(能力要求 掌握分布式EM算法。 (三)思考与实践 思考对于混合高斯模型如何运用分布式算法。 (四)教学方法与手段 课堂讲授 第四章马尔科夫链蒙特卡罗 (一)目的与要求 理解和掌握利用马尔科夫链产生具有渐进分布相近的随机数的方法 (二)教学内容 第一节Metropolis Hastings算法 1.主要内容 Metropolis Hastings算法产生随机数 2.基本概念和知识点 Metropolis Hastings算法 3.问题与应用(能力要求) 能够利用Metropolis Hastings算法产生随机数 第二节Slice取样法 1.主要内容 Slice取样法产生随机数 2.基本概念和知识点 Slice取样 3.问题与应用(能力要求 能够利用Slice取样算法产生随机数 第三节Gibbs取样法 1.主要内容 Gibbs取样法产生随机数 2.基本概念和知识点 Gibbs取样法 3.问题与应用(能力要求) 能够利用Slice取样算法产生随机数
4 1.主要内容 EM 算法,收敛性分析 2.基本概念和知识点 EM 算法 3.问题与应用(能力要求) 掌握分布式 EM 算法。 (三)思考与实践 思考对于混合高斯模型如何运用分布式 EM 算法。 (四)教学方法与手段 课堂讲授 第四章 马尔科夫链蒙特卡罗 (一)目的与要求 理解和掌握利用马尔科夫链产生具有渐进分布相近的随机数的方法 (二)教学内容 第一节 Metropolis Hastings 算法 1.主要内容 Metropolis Hastings 算法产生随机数 2.基本概念和知识点 Metropolis Hastings 算法 3.问题与应用(能力要求) 能够利用 Metropolis Hastings 算法产生随机数 第二节 Slice 取样法 1.主要内容 Slice 取样法产生随机数 2.基本概念和知识点 Slice 取样 3.问题与应用(能力要求) 能够利用 Slice 取样算法产生随机数 第三节 Gibbs 取样法 1.主要内容 Gibbs 取样法产生随机数 2.基本概念和知识点 Gibbs 取样法 3.问题与应用(能力要求) 能够利用 Slice 取样算法产生随机数
(三)思考与实践 思考Metropolis Hastings算法,Slice取样法,Gibbs取样法产生随机数的 差异。 (四)教学方法与手段 课堂讲授 第五章优化方法 (一)目的与要求 介绍最优化中的各种算法:交替方向乘子法,线性化Bregman迭代方法, 最速下降法,生顿法,拟生颇法,共扼梯度法,BFGS算法等方法 (二)教学内容 第一节交替方向乘子法,线性化Bregman迭代方法 1.主要内容 介绍针对不同优化问题的交替方向乘子法,线性化Bregman迭代方法 2.基本概念和知识点 交替方向乘子法、线性化Bregman迭代法 3.问题与应用(能力要求) 掌握交替方向乘子法,线性化Bregman迭代方法 第二节最速下降法,牛顿法 1.主要内容 介绍最速下降法的计算法,锯齿现象,介绍牛顿法 2.基本概念和知识点 最速下降方向,锯齿现象,牛顿方向 3.问题与应用(能力要求) 掌握最速下降法、牛顿法的计算方法,优缺点,锯齿现象的产生原因。 第三节拟牛顿法 1.主要内容 介绍拟牛顿法的迭代思想 2.基本概念和知识点 拟牛顿法 3.问题与应用(能力要求) 掌握拟牛顿法的计算方法,优缺点。 第四节共加梯度法,BFGS算法 1.主要内容 介绍共轭梯度法,BFGS算法的迭代思想 2.基本概念和知识点
5 (三)思考与实践 思考 Metropolis Hastings 算法,Slice 取样法, Gibbs 取样法产生随机数的 差异。 (四)教学方法与手段 课堂讲授 第五章 优化方法 (一)目的与要求 介绍最优化中的各种算法:交替方向乘子法,线性化 Bregman 迭代方法, 最速下降法,牛顿法,拟牛顿法,共轭梯度法,BFGS 算法等方法 (二)教学内容 第一节 交替方向乘子法,线性化 Bregman 迭代方法 1.主要内容 介绍针对不同优化问题的交替方向乘子法,线性化 Bregman 迭代方法 2.基本概念和知识点 交替方向乘子法、线性化 Bregman 迭代法 3.问题与应用(能力要求) 掌握交替方向乘子法,线性化 Bregman 迭代方法 第二节 最速下降法,牛顿法 1.主要内容 介绍最速下降法的计算法,锯齿现象,介绍牛顿法 2.基本概念和知识点 最速下降方向,锯齿现象,牛顿方向 3.问题与应用(能力要求) 掌握最速下降法、牛顿法的计算方法,优缺点,锯齿现象的产生原因。 第三节 拟牛顿法 1.主要内容 介绍拟牛顿法的迭代思想 2.基本概念和知识点 拟牛顿法 3.问题与应用(能力要求) 掌握拟牛顿法的计算方法,优缺点。 第四节 共轭梯度法,BFGS 算法 1.主要内容 介绍共轭梯度法,BFGS 算法的迭代思想 2.基本概念和知识点