《Python与大数据分析》教学大纲课程名称:Python与大数据分析课程类别(必修/选修):专业必修课课程英文名称:PythonandBigDataAnalysis其中实验/实践学时:24总学时/周学时/学分:48/3/3先修课程:程序设计I、程序设计IⅡI后续课程支撑:金融项目数据分析与开发授课时间:9-16周星期一3-4节、7-17周星期四9-11节授课地点:莞城校区实验楼503机房授课对象:23金融1班(科技)24人、23金融2班(管理)33人开课学院:粤台产业科技学院任课教师姓名/职称:苏宁/工程师答疑时间、地点与方式:7-16周1-2节、微信群、线上答疑课核方式:开卷()团()课程论文()其它()使用教材:《Python金融数据分析与挖掘实战》教学参考资料:课程简介:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。通过学习本课程,使得学生能够掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能,能够针对基本的数据挖掘间题与样例数据,调用Python中的第三方扩展包Numpy、Pandas、Matplotlib、Scikit-learn及关联规则算法代码,进行处理、计算与分析,从而为其他的专业领域课程或者复杂应用问题提供基础支撑。另外通过学习本课程,使得学生在掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能基础上,进一步地扩展应用到较为复杂金融数据处理及挖掘分析任务上,最后进行量化投资实战检验。本课程为Python在金融量化投资领域的具体应用,也是Python在金融行业应用最为广泛的领域之一,从而使得学生具备一定的行业应用背景及就业技能,课程教学目标及对毕业要求指标点的支撑毕业要求课程教学目标支撑毕业要求指标点1
1 《Python 与大数据分析》教学大纲 课程名称: Python 与大数据分析 课程类别(必修/选修):专业必修课 课程英文名称:Python and Big Data Analysis 总学时/周学时/学分:48/3/3 其中实验/实践学时:24 先修课程:程序设计 I、程序设计 II 后续课程支撑:金融项目数据分析与开发 授课时间: 9-16 周 星期一 3-4 节、7-17 周 星期四 9-11 节 授课地点:莞城校区实验楼 503 机房 授课对象: 23 金融 1 班(科技)24 人、23 金融 2 班(管理)33 人 开课学院: 粤台产业科技学院 任课教师姓名/职称: 苏宁/工程师 答疑时间、地点与方式:7-16 周 1-2 节、微信群、线上答疑 课程考核方式:开卷(√)闭卷()课程论文()其它( ) 使用教材:《Python 金融数据分析与挖掘实战》 教学参考资料: 课程简介:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。通过学习本课程,使得学生能够掌握 Python 科学 计算、数据处理、数据可视化、挖掘建模等基本技能,能够针对基本的数据挖掘问题与样例数据,调用 Python 中的第三方扩展包 Numpy、Pandas、 Matplotlib、Scikit-learn 及关联规则算法代码,进行处理、计算与分析,从而为其他的专业领域课程或者复杂应用问题提供基础支撑。另外通过学习 本课程,使得学生在掌握 Python 科学计算、数据处理、数据可视化、挖掘建模等基本技能基础上,进一步地扩展应用到较为复杂金融数据处理及挖掘 分析任务上,最后进行量化投资实战检验。本课程为 Python 在金融量化投资领域的具体应用,也是 Python 在金融行业应用最为广泛的领域之一,从而 使得学生具备一定的行业应用背景及就业技能。 课程教学目标及对毕业要求指标点的支撑: 课程教学目标 支撑毕业要求指标点 毕业要求
B2掌握计算机软件应用,以及经济与金目标1:了解在获取经济金融数据实践中所需的最新工具。融相关学科的基本理论、基础知识和基能部署Python开发环境,编写Python程序本技能B4掌握现代文献资料检索、查询的方法:具备办公软件及科研软件运用:提能使用Python常用数据分析模块进行数据处理和目标2:能使用新工具分析经济金融数据升计算机编程、云端运算、金融大数据分析分析、财金资料库检索与分析方面的知识A4专业素质具有创新精神、能适应数位金融技术发展需要,掌握互联网金融核心技术:具有金融创新能力,以从事金融商品开发及制作及其他计算机、财会、互联网金融领域工作的高级复合型人才:具有从事技术和服务工作所必需的创业精神:能够利用计算机应用能力配合本专业的发展解决目标3:培养学生跨专业跨学科的学习能力具有认真、严谨、求实、敬业的工作和本专业具体问题或提高解决问题的效率。学习态度,具有自信、团结协作的工作精神:C2具有良好的综合应用知识能力和实践能力,能把学到的经济学和金融学知识运用于实践2
2 目标 1:了解在获取经济金融数据实践中所需的最新工具。 B2 掌握计算机软件应用,以及经济与金 融相关学科的基本理论、基础知识和基 本技能 能部署 Python 开发环境,编写 Python 程序。 目标 2:能使用新工具分析经济金融数据 B4 掌握现代文献资料检索、查询的方 法;具备办公软件及科研软件运用;提 升计算机编程、云端运算、金融大数据 分析、财金资料库检索与分析方面的知 识 能使用 Python 常用数据分析模块进行数据处理和 分析 目标 3:培养学生跨专业跨学科的学习能力 A4 专业素质 具有创新精神、能适应数位金融技术发 展需要,掌握互联网金融核心技术;具 有金融创新能力,以从事金融商品开发 及制作及其他计算机、财会、互联网金 融领域工作的高级复合型人才;具有从 事技术和服务工作所必需的创业精神; 具有认真、严谨、求实、敬业的工作和 学习态度,具有自信、团结协作的工作 精神; C2 具有良好的综合应用知识能力和实 践能力,能把学到的经济学和金融学知 识运用于实践 能够利用计算机应用能力配合本专业的发展解决 本专业具体问题或提高解决问题的效率
理论教学进程表授课学时教学教学支撑课周次教学主题教学内容(重点、难点、课程思政融入点)作业安排教师数模式方法程目标1.课程教学内容:(1)Python及其发行版Anaconda的安装与启动、Spyder开发工具的使用和Python新库的安装方法(2)Python基本语法和数据结构。2.课程的重点、难点:在自己的电脑(1)重点:Python基本语法和数据结构的灵活运用:上部署好(2)难点:Python数据结构的灵活运用。线下目标17Python基础苏宁3讲授Python开发环3.课程教学要求:境(1)了解Python的安装及界面基本使用技能:(2)理解Python基本数据结构及方法的使用:(3)掌握Python基本数据结构的使用技能及循环、条件语句的应用。课程思政融入点:介绍编程语言发展史,了解Python目前在各领域的应用。了解我国的发展情况,与国外的差距。鼓励学生积极投身国家计算机科学技术。1.课程教学内容:导入并使用(1)导入并使用Numpy创建数组:Numpy创建数(2)数组的运算、切片、连接及存取、排序与搜索:数组相关属性与组:数组的运科学计算包方法:线下目标1苏宁3讲授8算、切片、连(3)矩阵及线性代数运算。Numpy基础接及存取、排2.课程的重点、难点:序与搜索:数(1)重点:数组的切片、连接、改变形态。数组的相关方法组相关属性与(2)难点:数组的切片及改变形态、线性代数运算。方法:矩阵及3.课程教学要求:线性代数运科学计算包(1)了解Numpy及导入使用:线下目标29讲授苏宁2算。Numpy应用(2)理解数组的创建、切片、连接、存取、排序及搜索相关技能3
3 理论教学进程表 周次 教学主题 授课 教师 学时 数 教学内容(重点、难点、课程思政融入点) 教学 模式 教学 方法 作业安排 支撑课 程目标 7 Python 基础 苏 宁 3 1.课程教学内容: (1) Python 及其发行版 Anaconda 的安装与启动、Spyder 开发工具 的使用和 Python 新库的安装方法; (2)Python 基本语法和数据结构。 2.课程的重点、难点: (1)重点:Python 基本语法和数据结构的灵活运用; (2)难点:Python 数据结构的灵活运用。 3.课程教学要求: (1)了解 Python 的安装及界面基本使用技能; (2)理解 Python 基本数据结构及方法的使用; (3)掌握 Python 基本数据结构的使用技能及循环、条件语句的应用。 课程思政融入点:介绍编程语言发展史,了解 Python 目前在各领域的 应用。了解我国的发展情况,与国外的差距。鼓励学生积极投身国家 计算机科学技术。 线下 讲授 在自己的电脑 上部署好 Python开发环 境 目标 1 8 科学计算包 Numpy 基础 苏 宁 3 1.课程教学内容: (1)导入并使用 Numpy 创建数组; (2)数组的运算、切片、连接及存取、排序与搜索;数组相关属性与 方法; (3)矩阵及线性代数运算。 2.课程的重点、难点: (1)重点:数组的切片、连接、改变形态。数组的相关方法; (2)难点:数组的切片及改变形态、线性代数运算。 3.课程教学要求: (1)了解 Numpy 及导入使用; (2)理解数组的创建、切片、连接、存取、排序及搜索相关技能; 线下 讲授 导入并使用 Numpy 创建数 组;数组的运 算、切片、连 接及存取、排 序与搜索;数 组相关属性与 方法;矩阵及 线性代数运 算。 目标 1 9 科学计算包 Numpy 应用 苏 宁 2 线下 讲授 目标 2
(3)掌握数组灵活切片的方法及数组连接、排序、搜索相关知识。导入并使用重点:Pandas对Dataframe中数据的增删查改:Pandas数据线下目标2Pandas创建数10苏宁2讲授操作据框和序列:难点:行列索引的理解数据框和序列Pandas数据重点:缺失值/重复值/异常值的检测与处理技术:数据排序:相关属性、方线下法的介绍及使目标2讲授11清洗/数据排苏宁2难点:数据排序用:数据框和序序列的访问、重点:Pandas常用计算函数的用法:数据格式化:数据分组统计:切片及运算:DataFrame的日期数据转换:时间序列:DataFrame序列、数组、列表(4)外部数据之间的相关转换及运用。线下文件的读取及目标212苏宁讲授Pandas进阶2滚动计算函数难点:数据分组统计、时间序列的使用。导入并使用1.课程教学内容:Matplotlib(1)导入并使用Matplotlib中的pyplot模块进行简单绘图:(2)Matplotlib中的pyplot模块绘图基本流程及原理:中的pyplot(3)利用Matplotlib中的yplot模块绘制常见的图形,包括散点图、模块进行简单绘图:线性图、柱状图、直方图、饼图、箱线图和子图。Matplotlib 基线下目标113苏宁讲授22.课程的重点、难点:Matplotlib础(1)重点:利用Matplotlib中的pyplot模块进行散点图、线性图、中的pyplot柱状图、直方图、饼图、箱线图和子图的绘制。懂得图形中文字符的模块绘图基本流程及原理:显示及横轴字符刻度,子图的布局排列:利用(2)难点:Matplotlib绘图的基本流程及原理。3.课程教学要求MatplotlibX
4 (3)掌握数组灵活切片的方法及数组连接、排序、搜索相关知识。 10 Pandas 数据 操作 苏 宁 2 重点:Pandas 对 Dataframe 中数据的增删查改; 难点:行列索引的理解 线下 讲授 导入并使用 Pandas创建数 据框和序列; 数据框和序列 相关属性、方 法的介绍及使 用;数据框和 序列的访问、 切片及运算; (4)外部数据 文件的读取及 滚动计算函数 的使用。 目标 2 11 Pandas 数据 清洗/数据排 序 苏 宁 2 重点:缺失值/重复值/异常值的检测与处理技术;数据排序; 难点:数据排序 线下 讲授 目标 2 12 Pandas 进阶 苏 宁 2 重点:Pandas 常用计算函数的用法;数据格式化;数据分组统计; DataFrame 的日期数据转换;时间序列;DataFrame 序列、数组、列表 之间的相关转换及运用。 难点:数据分组统计、时间序列 线下 讲授 目标 2 13 Matplotlib 基 础 苏 宁 2 1.课程教学内容: (1)导入并使用 Matplotlib 中的 pyplot 模块进行简单绘图; (2)Matplotlib 中的 pyplot 模块绘图基本流程及原理; (3)利用 Matplotlib 中的 yplot 模块绘制常见的图形,包括散点图、 线性图、柱状图、直方图、饼图、箱线图和子图。 2.课程的重点、难点: (1)重点:利用 Matplotlib 中的 pyplot 模块进行散点图、线性图、 柱状图、直方图、饼图、箱线图和子图的绘制。懂得图形中文字符的 显示及横轴字符刻度,子图的布局排列; (2)难点:Matplotlib 绘图的基本流程及原理。 3.课程教学要求: 线下 讲授 导入并使用 Matplotlib 中的 pyplot 模块进行简单 绘图; Matplotlib 中的 pyplot 模块绘图基本 流程及原理; 利用 Matplotlib 目标 1
(1)了解Matplotlib中的pyplot模块导入及简单使用方法:中的yplot模块绘制常见的(2)理解利用Matplotlib中的pyplot模块绘图的基本流程及原理:(3)掌握利用Matplotlib中的pyplot模块绘制散点图、线性图、柱图形,包括散状图、直方图、饼图、箱线图和子图的方法,以及中文字符的显示、点图、线性图、Matplotlib应目标2横轴字符刻度和子图的布局排列。线下柱状图、直方14苏宁2讲授用课程思政融入点:介绍大数据与信息安全和国家信息安全战略,提醒图、饼图、箱线图和子图。学生保护好个人信惠数据。1.课程教学内容:(1)导入Scikit-learn包及相关模块:(2)缺失值填充、数据规范化或标准化、主成分分析降维及综合评价、线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类相关的模导入型、算法与原理:Scikit-learn(3)利用Scikit-learn包相关模块,完成案例教学,包括均值、中包:缺失值填位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标充、数据规范机器学习基准化,主成分分析降维及综合评价:线性回归、神经网络非线性回归目标115苏宁线下2讲授化或标准化、础预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类主成分分析降2.课程的重点、难点:维及综合评(1)重点:均值、中位数、最频繁值的缺失值填充策略,均值-方差、价、线性回极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、归、逻辑回神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,归、神经网K-mean聚类相关原理的理解及程序实现:络、支持向量(2)难点:主成分分析降维及综合评价,线性回归、神经网络非线性机、K-均值聚回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类相关类相关的模型原理的理解。代码实现:机器学习应3.课程教学要求:线下讲授目标216苏宁2(1)了解Scikit-learn包及相关模块导入及简单使用方法:用(2)理解均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、5
5 14 Matplotlib 应 用 苏 宁 2 ( 1)了解 Matplotlib 中的 pyplot 模块导入及简单使用方法; ( 2)理解利用 Matplotlib 中的 pyplot 模块绘图的基本流程及原理; ( 3)掌握利用 Matplotlib 中的 pyplot 模块绘制散点图、线性图、柱 状图、直方图、饼图、箱线图和子图的方法,以及中文字符的显示、 横轴字符刻度和子图的布局排列。 课程思政融入点:介绍大数据与信息安全和国家信息安全战略,提醒 学生保护好个人信息数据。 线下 讲授 中的 yplot 模 块绘制常见的 图形,包括散 点图、线性图、 柱状图、直方 图、饼图、箱 线图和子图。 目标 2 15 机器学习基 础 苏 宁 2 1.课程教学内容: (1)导入 Scikit -learn 包及相关模块; ( 2)缺失值填充、数据规范化或标准化、主成分分析降维及综合评价、 线性回归、逻辑回归、神经网络、支持向量机、 K -均值聚类相关的模 型、算法与原理; (3)利用 Scikit -learn 包相关模块,完成案例教学,包括均值、中 位数、最频繁值的缺失值填充策略,均值 -方差、极差数据规范化或标 准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归 预测,逻辑回归、神经网络、支持向量机分类, K -mean 聚类; 2.课程的重点、难点: (1)重点:均值、中位数、最频繁值的缺失值填充策略,均值 -方差、 极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、 神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类, K-mean 聚类相关原理的理解及程序实现; (2)难点:主成分分析降维及综合评价,线性回归、神经网络非线性 回归预测,逻辑回归、神经网络、支持向量机分类, K -mean 聚类相关 原理的理解。 3.课程教学要求: (1)了解 Scikit -learn 包及相关模块导入及简单使用方法; ( 2)理解均值、中位数、最频繁值的缺失值填充策略,均值 -方差、 极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、 线下 讲授 导 入 Scikit -learn 包;缺失值填 充、数据规范 化或标准化、 主成分分析降 维及综合评 价、线性回 归、逻辑回 归、神经网 络、支持向量 机、 K -均值聚 类相关的模型 代码实现 ; 目标 1 16 机器学习应 用 苏 宁 2 线下 讲授 目标 2