《Python网络爬虫实务》教学大纲课程类别(必修/选修):选修课程名称:Python网络爬虫实务课程英文名称:PythonWebCrawlerPractice其中实验/实践学时:16总学时/周学时/学分:32/2/2先修课程:程序设计I,Web前端应用开发后续课程支撑:人工智能与机器学习授课地点:实验楼503机房授课时间:周三5,6节2-17周授课对象:2022级电商1,2班开课学院:粤台产业科技学院任课教师姓名/职称:贺丹/讲师答疑时间、地点与方式:课堂或课后,教室或通讯软件,当面或线上答照课程考核方式:开卷()闭卷()课程论文()其它(v)报告使用教材:《Python爬虫超详细实战攻略:微课视频版》,夏敏捷等,清华大学出版社,2021年1月,ISBN:9787302538752教学参考资料:无课程愉介:爬虫程序是数据技术收集信息的基础,爬取到需要的数据后,就可以对数据进行分析和建立应用。网络爬虫就是自动的从互联网上获取数据的程序。基本上我们在浏览网站时所能见到的数据都可以通过爬虫程序保存下来,可以透过爬虫程序来获取相关的数据。本课程主要分成四大部分,第一部分为网页基础复习,包括html,css,javascript,jQuery的介绍。第二部分为网络爬虫概念及数据请求方法介绍,包括肥虫基础知识、浏览器开发者工具及requests介绍。第三部分为数据提取方法,包括正则化、Xpath及beautifulsoup4等三种提取数据的方法。第四部分为进阶爬虫技术及综合实践,包括selenium工具及实际鹿虫演练。1
1 《Python 网络爬虫实务》教学大纲 课程名称:Python 网络爬虫实务 课程类别(必修/选修):选修 课程英文名称:Python Web Crawler Practice 总学时/周学时/学分:32/2/2 其中实验/实践学时:16 先修课程:程序设计 I,Web 前端应用开发 后续课程支撑:人工智能与机器学习 授课时间:周三 5,6 节 2-17 周 授课地点:实验楼 503 机房 授课对象:2022 级电商 1,2 班 开课学院:粤台产业科技学院 任课教师姓名/职称:贺丹/讲师 答疑时间、地点与方式:课堂或课后,教室或通讯软件,当面或线上答疑 课程考核方式:开卷() 闭卷( ) 课程论文() 其它(v)报告 使用教材: 《Python 爬虫超详细实战攻略:微课视频版》,夏敏捷等,清华大学出版社,2021 年 1 月,ISBN:9787302538752 教学参考资料: 无 课程简介: 爬虫程序是数据技术收集信息的基础,爬取到需要的数据后,就可以对数据进行分析和建立应用。网络爬虫就是自动的从互联网上获取数据的程序。 基本上我们在浏览网站时所能见到的数据都可以通过爬虫程序保存下来,可以透过爬虫程序来获取相关的数据。本课程主要分成四大部分,第一部分为 网页基础复习,包括 html, css, javascript, jQuery 的介绍。第二部分为网络爬虫概念及数据请求方法介绍,包括爬虫基础知识、浏览器开发者工具 及 requests 介绍。第三部分为数据提取方法,包括正则化、Xpath 及 beautifulsoup4 等三种提取数据的方法。第四部分为进阶爬虫技术及综合实践, 包括 selenium 工具及实际爬虫演练
课程教学目标及对毕业要求指标点的支撑:支撑毕业要求指标点毕业要求课程教学目标目标11-工程知识:能够运用数学、基础科学、计算机科培养学生具备智能互联网系统开发运维所涉及的软件工1-工程知识:能够将数学、自然科学、学与技术、企业互联网平台系统、电子商务信息管程、人工智能信息工程、商务信息管理等方面专业知识与工程基础和专业知识用于解决计算机理与信息系统、电子商务经营管理等相关知识,对技能,成为专业技术人才,能以科学方法解决问题与进行工程专业的复杂工程问题。企业互联网与电子商务系统开发运维问题具有解创新。决能力。目标2:3-设计/开发解决方案:能够设计(开3-设计/开发解决方案:能够掌握企业互联网与电培养学生具有独立思考、创新思维、组织管理、沟通协调、发)满足计算机工程特定需求的体系,子商务系统的前端设计、后端设计、数据库设计、自我挑战、终身学习的能力。并在设计环节中考虑社会、健康、安全、数据挖掘、大数据分析、云计算等基础理论与技术,法律、文化及环境等因素。在提出复杂具有追求创新的意识,对企业互联网与电子商务系工程问题的解决方案时具有创新意识。统开发运维问题提出创新解决方案。目标3:8-职业规范:具有人文社会科学素养、8-职业规范:进行企业互联网与电子商务系统开发提升学生人文素养、社会服务的情操,培养学生良好的职社会责任感,能够在工程实践中理解并运维工作时,能够遵守职业道德与规范,履行社会业道德与社会责任感。遵守工程职业道德和行为规范,做到责责任并发挥正面影响力。任担当、贡献国家、服务社会。目标4:9-个人和团队:在解决计算机工程专业9-个人和团队:具有积极正面谋事的人格特质与良培养学生具有创新力、团队力、专业力、跨界力、服务力的复杂工程问题时,能够在多学科组成性团队互动的做事态度,在企业互联网与电子商务与英语运用能力,并具有国际观,举献社会国家及人类。的团队中承担个体、团队成员或负责人系统开发运维复杂问题解决过程中能够发挥关键的角色。性作用,让问题以团队合作方式快速完成。2
2 课程教学目标及对毕业要求指标点的支撑: 课程教学目标 支撑毕业要求指标点 毕业要求 目标 1: 培养学生具备智能互联网系统开发运维所涉及的软件工 程、人工智能信息工程、商务信息管理等方面专业知识与 技能,成为专业技术人才,能以科学方法解决问题与进行 创新。 1-工程知识:能够将数学、自然科学、 工程基础和专业知识用于解决计算机 工程专业的复杂工程问题。 1-工程知识:能够运用数学、基础科学、计算机科 学与技术、企业互联网平台系统、电子商务信息管 理与信息系统、电子商务经营管理等相关知识,对 企业互联网与电子商务系统开发运维问题具有解 决能力。 目标 2: 培养学生具有独立思考、创新思维、组织管理、沟通协调、 自我挑战、终身学习的能力。 3-设计/开发解决方案:能够设计(开 发)满足计算机工程特定需求的体系, 并在设计环节中考虑社会、健康、安全、 法律、文化及环境等因素。在提出复杂 工程问题的解决方案时具有创新意识。 3-设计/开发解决方案:能够掌握企业互联网与电 子商务系统的前端设计、后端设计、数据库设计、 数据挖掘、大数据分析、云计算等基础理论与技术, 具有追求创新的意识,对企业互联网与电子商务系 统开发运维问题提出创新解决方案。 目标 3: 提升学生人文素养、社会服务的情操,培养学生良好的职 业道德与社会责任感。 8-职业规范:具有人文社会科学素养、 社会责任感,能够在工程实践中理解并 遵守工程职业道德和行为规范,做到责 任担当、贡献国家、服务社会。 8-职业规范:进行企业互联网与电子商务系统开发 运维工作时,能够遵守职业道德与规范,履行社会 责任并发挥正面影响力。 目标 4: 培养学生具有创新力、团队力、专业力、跨界力、服务力 与英语运用能力,并具有国际观,奉献社会国家及人类。 9-个人和团队:在解决计算机工程专业 的复杂工程问题时,能够在多学科组成 的团队中承担个体、团队成员或负责人 的角色。 9-个人和团队:具有积极正面谋事的人格特质与良 性团队互动的做事态度,在企业互联网与电子商务 系统开发运维复杂问题解决过程中能够发挥关键 性作用,让问题以团队合作方式快速完成
理论教学进程表教学模式支撑课周次教学主题授课教师学时数教学内容(重点、难点、课程思政融入点)教学方法作业安排线下/混合式程目标目标一课堂讲授与置点:PyCharm、HBuilderX、typora软件线下贺丹12目标三开发工具安装小组讨论安装、爬虫相关法律问题解读目标四重点:资源路径、列表标签、表格标签难点:表单提交课堂讲授与课程恩政融入点:透过人文关怀角度教学目标一线下贺丹13HTML操作小组讨论目标二阐述网络爬虫概念,培养学生具备专业知识用于造福人民,善尽社会责任,业养成科学严谨、认真细致、实事求是的科学态度和职业道德。课堂讲授与重点:css引入、css属性、css选择器目标一贺丹I线下4CSS操作小组讨论目标二难点:css选择器重点:JS使用、数据类型、函数定义、条课堂讲授与JavaScript操课后作业:HTML目标一贺丹1线下1O件语句小组讨论作I与CSS练习目标二难点:函数定义、条件语句重点:获取标签属性、操作标签属性、数课堂讲授与目标一JavaScript操贺丹线下16组操作、循环语句、字符串拼接、对象小组讨论作II目标二难点:获取标签属性、操作标签属性3
3 理论教学进程表 周次 教学主题 授课教师 学时数 教学内容(重点、难点、课程思政融入点) 教学模式 线下/混合式 教学方法 作业安排 支撑课 程目标 2 开发工具安装 贺丹 1 重点:PyCharm、HBuilderX、typora 软件 安装、爬虫相关法律问题解读 线下 课堂讲授与 小组讨论 目标一 目标三 目标四 3 HTML 操作 贺丹 1 重点:资源路径、列表标签、表格标签 难点:表单提交 课程思政融入点:透过人文关怀角度教学 阐述网络爬虫概念,培养学生具备专业知 识用于造福人民,善尽社会责任,並养成 科学严谨、认真细致、实事求是的科学态 度和职业道德。 线下 课堂讲授与 小组讨论 目标一 目标二 4 CSS 操作 贺丹 1 重点:css 引入、css 属性、css 选择器 难点:css 选择器 线下 课堂讲授与 小组讨论 目标一 目标二 5 JavaScript 操 作 I 贺丹 1 重点:JS 使用、数据类型、函数定义、条 件语句 难点:函数定义、条件语句 线下 课堂讲授与 小组讨论 课后作业:HTML 与 CSS 练习 目标一 目标二 6 JavaScript 操 作 II 贺丹 1 重点:获取标签属性、操作标签属性、数 组操作、循环语句、字符串拼接、对象 难点:获取标签属性、操作标签属性 线下 课堂讲授与 小组讨论 目标一 目标二
重点:jQuery用法、jQuery选择器、选择集过滤、获取和设置元素内容难点:jQuery选择器、获取和设置元素内容课堂讲授与目标一课程思政融入点:通过学习jQuery选择贺丹线下7jQuery操作!小组讨论目标二器和获取、设置元素内容,同学们可以培养细致入微的工作态度。选择器的使用需要同学们仔细思考和准确定位网页元素,这种细致的态度在实际工作中同样重要。鼓励同学们要学会从细节入手,确保每一步操作的准确性和有效性。重点:获取和设置元素属性、jQuery事件、目标一课堂讲授与json、ajax贺丹线下18jQuery操作II小组讨论目标二难点:获取和设置元素属性、jQuery事件、ajax重点:爬虫的流程、HTTP基本原理、HTTP请求的形式课后作业:目标一难点:HTTP请求的形式课堂讲授与线下贺丹19爬虫基础知识JavaScript与小组讨论目标二jQuery练习课程思政融入点:通过爬虫流程的学习,强调系统化思维和解决问题的能力。引导4
4 7 jQuery 操作 I 贺丹 1 重点:jQuery 用法、jQuery 选择器、选 择集过滤、获取和设置元素内容 难点:jQuery 选择器、获取和设置元素内 容 课程思政融入点:通过学习 jQuery 选择 器和获取、设置元素内容,同学们可以培 养细致入微的工作态度。选择器的使用需 要同学们仔细思考和准确定位网页元素, 这种细致的态度在实际工作中同样重要。 鼓励同学们要学会从细节入手,确保每一 步操作的准确性和有效性。 线下 课堂讲授与 小组讨论 目标一 目标二 8 jQuery 操作 II 贺丹 1 重点:获取和设置元素属性、jQuery 事件、 json、ajax 难点:获取和设置元素属性、jQuery 事件、 ajax 线下 课堂讲授与 小组讨论 目标一 目标二 9 爬虫基础知识 贺丹 1 重点:爬虫的流程、HTTP 基本原理、HTTP 请求的形式 难点:HTTP 请求的形式 课程思政融入点:通过爬虫流程的学习, 强调系统化思维和解决问题的能力。引导 线下 课堂讲授与 小组讨论 课后作业 : JavaScript 与 jQuery 练习 目标一 目标二
学生认识到,爬虫技术在数据收集和分析中发挥着重要作用,但必须遵守法律法规,尊重他人的隐私和版权。通过合法合规的爬虫实践,培养学生的社会责任感和职业道德。重点:浏览器开放者工具使用、socket课堂讲授与目标一浏览器开放者贺丹线下1介绍10工具操作小组讨论目标二难点:socket操作量点:requests基础操作、发送post请课堂讲授与目标一requests发送求、使用代理、cookie使用贺丹线下11请求难点:发送post请求、使用代理、cookie小组讨论目标二使用重点:正则表达式使用方法目标一数据提取方法:课堂讲授与贺丹I线下12正则表达式难点:正则表达式使用方法小组讨论目标二重点:Xpath安装、Xpath语法、Ixml模块难点:Xpath语法、1xml模块数据提取方法:课堂讲授与目标三贺丹线下113Xpath小组讨论目标四课程政融入点:通过华为公司在5G网络通讯技术领先全球却遭到美国无情打压的案例,鼓励同学们面对问题克服问题,学习从逆境中持续成长进步。引导同5
5 学生认识到,爬虫技术在数据收集和分析 中发挥着重要作用,但必须遵守法律法 规,尊重他人的隐私和版权。通过合法合 规的爬虫实践,培养学生的社会责任感和 职业道德。 1 0 浏览器开放者 工具操作 贺丹 1 重点:浏览器开放者工具使用、 socket 介绍 难点 : socket 操作 线下 课堂讲授与 小组讨论 目标一 目标二 1 1 requests 发送 请求 贺丹 1 重点 : requests 基础操作、发送 post 请 求、使用代理、 cookie 使用 难点:发送 post 请求、使用代理、 cookie 使用 线下 课堂讲授与 小组讨论 目标一 目标二 1 2 数据提取方法: 正则表达式 贺丹 1 重点:正则表达式使用方法 难点:正则表达式使用方法 线下 课堂讲授与 小组讨论 目标一 目标二 1 3 数据提取方法: Xpath 贺丹 1 重点 :Xpath 安装、 Xpath 语法、 lxml 模 块 难点 : Xpath 语法、 lxml 模块 课程思政融入点 :通过华为公司在 5G 网 络通讯技术领先全球却遭到美国无情打 压的案例,鼓励同学们面对问题克服问 题,学习从逆境中持续成长进步。引导同 线下 课堂讲授与 小组讨论 目标三 目标四