《数据采集与挖掘》课程实验教学大纲 一、课程基本信息 课程代码:21020053 课程名称:《数据采集与挖掘》 英文名称:《Data Acquisition and Mining)》 实验总学时:48 适用专业:会计学、财务管理、审计学 课程类别:专业选修课 先修课程:《Python基础》《初级财务会计学》、《会计学》、《数据库管理 系统》、《管理信息系统》、《财务管理》、《成本会计》等基础课程 二.实验教学的性质、目的与任务要求 (一)实验教学的性质和目的 大数据时代已经全面开启,带来了信息技术发展的巨大变革,并深刻影响 着社会生产和人民生活的方方面面。了解大数据概念、具备大数据思维,是新 时代对人才的新要求。本课程通过案例引入并探讨大数据的实质,内容深入浅 出,通俗易懂,适合财会专业相关学生们学习。本课程阐述了培养具有数据素 养的技术技能型人才所需要的大数据相关基础知识。在确定知识布局时,秉持 的一个基本原则是,紧紧围绕大数据通识教育核心理念,培养学生的数据意识 、数据思维、数据安全和数据分析能力。本实验教学的内容主要包括大数据概 述,大数据思维,数据库基础知识,数据采集与挖掘相关应用,数据可视化概 论,大数据安全,大数据与云计算、物联网、人工智能、数字货币、区块链等 新一代信息技术的融合应用。为了避免陷入空洞的理论介绍,本实验教学在很 多章节都融入了丰富的案例,这些案例就发生在我们生活的大数据时代,很具 有代表性和说服力,能够让学生直观感受相应理论的具体内涵。 (二)实验教学的任务要求
《数据采集与挖掘》课程实验教学大纲 一、课程基本信息 课程代码:21020053 课程名称:《数据采集与挖掘》 英文名称:《Data Acquisition and Mining) 》 实验总学时:48 适用专业:会计学、财务管理、审计学 课程类别:专业选修课 先修课程:《Python 基础》《初级财务会计学》、《会计学》、《数据库管理 系统》、《管理信息系统》、《财务管理》、《成本会计》等基础课程 二. 实验教学的性质、目的与任务要求 (一) 实验教学的性质和目的 大数据时代已经全面开启,带来了信息技术发展的巨大变革,并深刻影响 着社会生产和人民生活的方方面面。了解大数据概念、具备大数据思维,是新 时代对人才的新要求。本课程通过案例引入并探讨大数据的实质,内容深入浅 出,通俗易懂,适合财会专业相关学生们学习。本课程阐述了培养具有数据素 养的技术技能型人才所需要的大数据相关基础知识。在确定知识布局时,秉持 的一个基本原则是,紧紧围绕大数据通识教育核心理念,培养学生的数据意识 、数据思维、数据安全和数据分析能力。本实验教学的内容主要包括大数据概 述,大数据思维,数据库基础知识,数据采集与挖掘相关应用,数据可视化概 论,大数据安全,大数据与云计算、物联网、人工智能、数字货币、区块链等 新一代信息技术的融合应用。为了避免陷入空洞的理论介绍,本实验教学在很 多章节都融入了丰富的案例,这些案例就发生在我们生活的大数据时代,很具 有代表性和说服力,能够让学生直观感受相应理论的具体内涵。 (二) 实验教学的任务要求
1、对学生的要求 高校课程建设要进一步打破学科、专业壁垒,推动文科专业之间的深度酷 通,以及文科与理工农医科的交叉融合,融入现代信息技术,赋能文科教育, 实现文科教育的自我革新。《数据采集与挖掘》是培养德、智、体、美、劳全 面发展,具有良好的政治素质和道德修养,掌握扎实的基础理论和专业知识、 良好的团队意识和协作能力,打破局限的学科认知和专业限制,提升自身综合 素养,提升新文科的通识传承和知识创新能力。具备包括数据思维在内的科学 思维能力、解决财会等行业数据密集型问题为主的动手能力以及大数据分析或 大数据应用开发技能,在财会等相关行业数据分析系统的开发、部署与应用等 方面具有就业竞争力的高素质复合型应用人才。针对学生已经具备《管理经济 学》、《经济法》、《财务管理》等专业知识和能力的特点,《数据采集与挖 掘》试图采用理论分析与案例讲解相结合的方法,使学生能够全面深入地理解 和掌握大数据技术的发展与演进过程,通过大数据应用的场景介绍,熟悉大数 据技术应用的商业价值,介绍大数据常用编程软件,了解大数据技术开源平台 和工具,拓展大数据应用能力。本课程,侧重实践操作动手能力培养的一门课 程。因此要求学生在深刻理解会计信息系统基本理论、基本方法和基本管理制 度的基础上,侧重于具体软件的操作和应用。课程内容分为数据采集与挖掘基 本理论和Phython软件应用两部分。 2、对教师的要求 教师要持续推动课程教育教学内容更新迭代,培养学生的跨领域知识融通 能力和实践能力。针对学生已经具备《管理经济学》、《经济法》、《财务管 理》等专业知识和能力的特点,《数据采集与挖掘》试图采用理论分析与案例 讲解相结合的方法,使学生能够全面深入地理解和掌握大数据技术的发展与演 进过程,通过大数据应用的场景介绍,熟悉大数据技术应用的商业价值,介绍 大数据常用编程软件,了解大数据技术开源平台和工具,拓展大数据应用能力 3、培养目标 本课程旨在实现以下几个培养目标: (1)引导学生步入大数据时代,积极投身大数据的变革浪潮之中: (2)了解大数据概念,培养大数据思维,养成数据安全意识:
1、对学生的要求 高校课程建设要进一步打破学科、专业壁垒,推动文科专业之间的深度融 通,以及文科与理工农医科的交叉融合,融入现代信息技术,赋能文科教育, 实现文科教育的自我革新。《数据采集与挖掘》是培养德、智、体、美、劳全 面发展,具有良好的政治素质和道德修养,掌握扎实的基础理论和专业知识、 良好的团队意识和协作能力,打破局限的学科认知和专业限制,提升自身综合 素养,提升新文科的通识传承和知识创新能力。具备包括数据思维在内的科学 思维能力、解决财会等行业数据密集型问题为主的动手能力以及大数据分析或 大数据应用开发技能,在财会等相关行业数据分析系统的开发、部署与应用等 方面具有就业竞争力的高素质复合型应用人才。针对学生已经具备《管理经济 学》、《经济法》、《财务管理》等专业知识和能力的特点,《数据采集与挖 掘》试图采用理论分析与案例讲解相结合的方法,使学生能够全面深入地理解 和掌握大数据技术的发展与演进过程,通过大数据应用的场景介绍,熟悉大数 据技术应用的商业价值,介绍大数据常用编程软件,了解大数据技术开源平台 和工具,拓展大数据应用能力。本课程,侧重实践操作动手能力培养的一门课 程。因此要求学生在深刻理解会计信息系统基本理论、基本方法和基本管理制 度的基础上,侧重于具体软件的操作和应用。课程内容分为数据采集与挖掘基 本理论和 Phython 软件应用两部分。 2、对教师的要求 教师要持续推动课程教育教学内容更新迭代,培养学生的跨领域知识融通 能力和实践能力。针对学生已经具备《管理经济学》、《经济法》、《财务管 理》等专业知识和能力的特点,《数据采集与挖掘》试图采用理论分析与案例 讲解相结合的方法,使学生能够全面深入地理解和掌握大数据技术的发展与演 进过程,通过大数据应用的场景介绍,熟悉大数据技术应用的商业价值,介绍 大数据常用编程软件,了解大数据技术开源平台和工具,拓展大数据应用能力 。 3、培养目标 本课程旨在实现以下几个培养目标: (1)引导学生步入大数据时代,积极投身大数据的变革浪潮之中; (2)了解大数据概念,培养大数据思维,养成数据安全意识;
(3)掌握数据采集的基本流程、方法和基本技术: (4)熟悉使用Python语言进行数据采集,能够独立设计、开发、测试和 维护爬虫程序等: (5)养成善于动脑、勤于思考的学习习惯:养成规范的软件代码编写习惯: 具有良好的沟通能力和团队协作精神等。 4、对实验条件的相关要求 实验课程对计算机等教学环节的软硬件条件要求如下。 硬件要求: (1)计算机,P4-2.4,8G内存,1TG硬盘: (2)自主上机机房管理信息系统:开放机房: (③)网络环境,每个小组局域网互通,使用教学系统管理软件上课: (4)网络硬盘下TP学生个人空间,方便学生存取个人账套: (⑤)资源环境,专题实验教学资源网站和实验教学辅助系统。 软件要求: 1.Python3.8(或更高版本) 2.Internet Explorer6.0+SP1及更高版本 3.I1S5.0及更高版本 4.NET Framework 2.0 Service Pack 1 5.Dockers和Spark 三实验教学内容 (一)教学方法 本课程以课程理论教学为主,并安排课堂讨论,以深化学生对知识的理解 在理论教学层面,高屋建瓴地探讨大数据,超脱技术讲解技术,内容深入浅出 ,通俗易懂,适合非计算机专业学生学习:同时,在课堂上为学生展示丰言的 实际应用案例,激发学生学习兴趣,开拓学生视野,培养学生大数据思维。 (二)教学内容 本课程的理论课程相关教学内容如下表所示:
(3)掌握数据采集的基本流程、方法和基本技术; (4)熟悉使用 Python 语言进行数据采集,能够独立设计、开发、测试和 维护爬虫程序等; (5)养成善于动脑、勤于思考的学习习惯;养成规范的软件代码编写习惯; 具有良好的沟通能力和团队协作精神等。 4、对实验条件的相关要求 实验课程对计算机等教学环节的软硬件条件要求如下。 硬件要求: (1)计算机,P4-2.4,8G 内存,1TG 硬盘; (2)自主上机机房管理信息系统;开放机房; (3)网络环境,每个小组局域网互通,使用教学系统管理软件上课; (4)网络硬盘 FTP 学生个人空间,方便学生存取个人账套; (5)资源环境,专题实验教学资源网站和实验教学辅助系统。 软件要求: 1. Python 3.8 (或更高版本) 2. Internet Explorer 6.0 + SP1 及更高版本 3. IIS 5.0 及更高版本 4. NET Framework 2.0 Service Pack 1 5. Dockers 和 Spark 三. 实验教学内容 (一) 教学方法 本课程以课程理论教学为主,并安排课堂讨论,以深化学生对知识的理解。 在理论教学层面,高屋建瓴地探讨大数据,超脱技术讲解技术,内容深入浅出 ,通俗易懂,适合非计算机专业学生学习;同时,在课堂上为学生展示丰富的 实际应用案例,激发学生学习兴趣,开拓学生视野,培养学生大数据思维。 (二) 教学内容 本课程的理论课程相关教学内容如下表所示:
项目(或章) 主要内容 学时安排 数据的概念、大数据时代到来的背景、大数 大数据论与加数 培的装历程、世界的 的概念与影响 数据的应用以及 n0py pandas 库的学习 第】次讨论课 numpy库、pandas库在财务上的应用 薇配体数指爬虫、可 9 爬虫学习,爬取京东商品评论并可视化 取石想资河网公司担关信自并可切化 第2次讨论课 信息获取后的加工处理:小组展示 大数据分折全流程所洗及的各种技术:爬取 第3章爬虫进阶 巨潮资讯网上市公司的股市行情pyecharts 库使用一一制作股票价格折线图 第3次讨论课 小组展示 大数据在各行各业的主要应用:其他数据网 第4章可视化进阶 站的爬取;pyecharts库进阶使用一一制作 8 3D图 第4次讨论课 小组展示 1 大数据安全问题、数据保护原则、数据安全 第5章实战训练 隐保护对例 平台:chatGPT在 数据采集与挖据上的 第5次讨论课 小组展示 合计 本课程的实验教学部分设计了部分实验项目,具体如下: 实验项目一 实验名称:Anaconda和Python安装与配置 实验内容:安装Anaconda和Python 实验性质:验证性实验 实验学时:3学时 实验目的与要求:Hadoop单机和集群模式的配置或者jupyterhub集群 实验条件:计算机,P4-2.4,8G内存,1TG硬盘:自主上机机房管理信息 系统 研究与思考:(I)安装Anaconda和Python;(2)安装系统的安装包: (3)课程的思政内容:立足学科分类和课程评价体系改革,系统推进各学科体
本课程的实验教学部分设计了部分实验项目,具体如下: 实验项目一 实验名称:Anaconda 和 Python 安装与配置 实验内容:安装 Anaconda 和 Python 实验性质:验证性实验 实验学时:3 学时 实验条件:计算机,P4-2.4,8G 内存,1TG 硬盘;自主上机机房管理信息 系统 研究与思考:(1)安装 Anaconda 和 Python;(2)安装系统的安装包; (3)课程的思政内容:立足学科分类和课程评价体系改革,系统推进各学科体 项目(或章) 主要内容 学时安排 第 1 章 大数据概论与 python 数 据分析 数据的概念、大数据时代到来的背景、大数 据的发展历程、世界各国的大数据发展战略 、大数据的概念与影响、大数据的应用以及 大数据产业; Python 的安装; numpy、 pandas 库的学习 9 第 1 次讨论课 numpy 库、pandas 库在财务上的应用 1 第 2 章 大数据思维;爬虫、可 视化初体验 物联网的概念和应用、云计算的概念和应用 、大数据和云计算以及物联网的相互关系; 爬虫学习,爬取京东商品评论并可视化;爬 取巨潮资讯网公司相关信息并可视化 9 第 2 次讨论课 信息获取后的加工处理;小组展示 1 第 3 章 爬虫进阶 大数据分析全流程所涉及的各种技术;爬取 巨潮资讯网上市公司的股市行情 pyecharts 库使用——制作股票价格折线图 9 第 3 次讨论课 小组展示 1 第 4 章 可视化进阶 大数据在各行各业的主要应用;其他数据网 站的爬取; pyecharts 库进阶使用——制作 3D 图 8 第 4 次讨论课 小组展示 1 第 5 章 实战训练 大数据安全问题、数据保护原则、数据安全 和 隐私保护对策;例子:商协会政策查询 服务平台;chatGPT 在数据采集与挖掘上的 应用 8 第 5 次讨论课 小组展示 1 合计 48 实验目的与要求:Hadoop 单机和集群模式的配置 或者 jupyterhub 集群
系课程思政的科学化、专业化路径建设,为课程思政改革奠定学科和课程基础 。能为师生提供远程高效计算存储平台。学生可以在线做练习写代码,不需要 硬件,网页即可支持R、java和Python语言,能省不少硬件成本。 实验项目二 实验名称:应用python爬取某政府部门规范性文件 实验内容:在Hadoop平台对某政府的部门规范性文件进行爬取 实验性质:验证性实验 实验学时:3学时 实验目的与要求:熟悉Python的NumPy、.SciPy、Pandas和Matplotlib 各种程序库,使其在数据分析领域的广泛应用。能安装爬虫所需环境,创建简单 的爬虫项目。成功完成爬虫核心实现。 实验条件:广东财经大学大数据Hadoop平台/同心楼实验室 研究与思考:(l)对Python的NumPy、SciPy、Pandas和Matplotlib各 种数据库进行熟悉:(2)创建简单的爬虫代码:(3)运用Python对政府文件 进行爬取:(4)课程的思政内容:通过“某政府部门设立小金库的案例”, 引导同学牢记初心使命、树立政治能力过硬、敢于担当作为、勇于纠错防弊的 正确价值观,切实做到“清正廉洁”。pythor爬取某政府部门规范性文件,要 学生们学习党和国家的政策,鼓励学生学好专业知识。 实验项目三 实验名称:爬取豆瓣和猫眼电影影评及可视化分析 实验内容:用Python对豆瓣或者猫眼网站中某部电影的影评进行爬取,并 对数据进行可视化分析 实验性质:验证性实验 实验学时:3学时 实验目的与要求:熟悉Python的NumPy、.SciPy、Pandas和Matplotlib 各种程序库,使其在数据分析领域的广泛应用。能安装爬虫所需环境,创建简单 的爬虫项目,成功完成爬虫核心实现,再对爬取出来的影评进行可视化
系课程思政的科学化、专业化路径建设,为课程思政改革奠定学科和课程基础 。能为师生提供远程高效计算存储平台。学生可以在线做练习写代码,不需要 硬件,网页即可支持 R、java 和 Python 语言,能省不少硬件成本 。 实验项目二 实验名称:应用 python 爬取某政府部门规范性文件 实验内容:在 Hadoop 平台对某政府的部门规范性文件进行爬取 实验性质:验证性实验 实验学时:3 学时 实验目的与要求:熟悉 Python 的 NumPy、SciPy、Pandas 和 Matplotlib 各种程序库,使其在数据分析领域的广泛应用。能安装爬虫所需环境,创建简单 的爬虫项目。成功完成爬虫核心实现。 实验条件:广东财经大学大数据 Hadoop 平台/同心楼实验室 研究与思考:(1)对 Python 的 NumPy、SciPy、Pandas 和 Matplotlib 各 种数据库进行熟悉;(2)创建简单的爬虫代码;(3)运用 Python 对政府文件 进行爬取;(4)课程的思政内容:通过“某政府部门设立小金库的案例”, 引导同学牢记初心使命、树立政治能力过硬、敢于担当作为、勇于纠错防弊的 正确价值观,切实做到“清正廉洁”。python 爬取某政府部门规范性文件,要 学生们学习党和国家的政策,鼓励学生学好专业知识。 实验项目三 实验名称:爬取豆瓣和猫眼电影影评及可视化分析 实验内容:用 Python 对豆瓣或者猫眼网站中某部电影的影评进行爬取,并 对数据进行可视化分析 实验性质:验证性实验 实验学时:3 学时 实验目的与要求:熟悉 Python 的 NumPy、SciPy、Pandas 和 Matplotlib 各种程序库,使其在数据分析领域的广泛应用。能安装爬虫所需环境,创建简单 的爬虫项目,成功完成爬虫核心实现,再对爬取出来的影评进行可视化