《Python数据分析》课程大纲课程基本信息(CourseInformation)课程编号*学时*学分1163020011322(Credits)(Course ID)(Credit Hours)Python数据分析*课程名称(CourseName)Data Analysis with Python先修课程(PrerequisiteCourses)在信息时代,以几何级数增加的数据形成了海量数据集,如何从这些数据中寻找有价值的信息就变得十分重要,大数据及数据分析技术已经成为信息技术中十分重要的一个环节。随着互联网+的不断发展,在所有行业中,数据分析技术都能发挥一定作用。中国特色社会主义进入新时代,实现中华民族伟大复兴的中国梦开启新征程。党中央决定实施国家大数据战略,吹响了加快发展数字经济、建设数字中国的号角。习近平总书记在十九届中共中央政治局第二次集体学习时的重要讲话中指出:“大数据是信息化发展的新阶段,并做出了推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全"的战略部署,为我国构筑大数据时代国家综合竞争新优势指明了方向。近年来,Python已经成为学习数据分析的首选编程语言。首先,Python语言简单易用,学习*课程简介门槛不高,对于非计算机专业人员十分友好;其次,Python有很多功能强大的第三方库,可以覆(Description)盖数据分析中从数据获取、数据清洗、数据可视化、数据挖掘、机器学习等各个环节,是名副其实的数据分析全栈语言。本课程的主要内容就是如何使用Python进行数据分析,包括了NumPy、pandas、matplotlib、pyecharts、scikit-learn等最常用的数据分析库的使用,以及如何使用这些库完成数据分析的整个流程。课程中也会包含一些实际的案例,通过这些案例能够更好的掌握数据分析相关技术。课程中大部分内容都以实践操作为主,涉及纯理论的环节并不太多。课程的重点在于各种数据分析库的基本用法,综合运行这些库进行数据分析是课程的难点。本课程采用课堂讲授与练习相结合的教学方法,课程成绩由考勤、课后作业完成情况以及期末成绩构成。另外,课程不包含Python基础语法的介绍,选择该课程之前必须修过Python基础语法相关课程或者自学过相关内容。In the informationage,massivedata sets areformedbygeometrically increasingdataHowtofindvaluable information fromthesedatabecomesveryimportant.Bigdataanddata analysis technology have become a very important part of information technology.With the continuous development of Internet+,data analysis technology canplayacertain role in all industries. Socialism with Chinese characteristics has entered a new era,*课程简介and a new journey has begun to realizethe Chinesedream of thegreat rejuvenation of(Description)theChinesenation.ThePartyCentral Committeedecidedto implementthenational bigdata strategy,sounding the clarion call to accelerate the development of the digitaleconomy and build a digital China.In his important speech at the second collectivestudyof thePolitical Bureauof the19th CPC Central Committee,General SecretaryXi Jinpingpointed out that"bigdata is a new stage of informatization development",and made"promoting the innovation and development of the bigdata technology industry
《Python 数据分析》课程大纲 课程基本信息(Course Information) 课程编号 (Course ID) 1163020011 *学时 (Credit Hours) 32 *学分 (Credits) 2 *课程名称 (Course Name) Python 数据分析 Data Analysis with Python 先修课程 (Prerequisite Courses) *课程简介 (Description) 在信息时代,以几何级数增加的数据形成了海量数据集,如何从这些数据中寻找有价值的信息 就变得十分重要,大数据及数据分析技术已经成为信息技术中十分重要的一个环节。随着互联网+ 的不断发展,在所有行业中,数据分析技术都能发挥一定作用。中国特色社会主义进入新时代,实 现中华民族伟大复兴的中国梦开启新征程。党中央决定实施国家大数据战略,吹响了加快发展数字 经济、建设数字中国的号角。习近平总书记在十九届中共中央政治局第二次集体学习时的重要讲话 中指出:“大数据是信息化发展的新阶段”,并做出了“推动大数据技术产业创新发展、构建以数据为 关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切 实保障国家数据安全”的战略部署,为我国构筑大数据时代国家综合竞争新优势指明了方向。 近年来,Python 已经成为学习数据分析的首选编程语言。首先,Python 语言简单易用,学习 门槛不高,对于非计算机专业人员十分友好;其次,Python 有很多功能强大的第三方库,可以覆 盖数据分析中从数据获取、数据清洗、数据可视化、数据挖掘、机器学习等各个环节,是名副其实 的数据分析全栈语言。本课程的主要内容就是如何使用 Python 进行数据分析,包括了 NumPy、 pandas、matplotlib、pyecharts、scikit-learn 等最常用的数据分析库的使用,以及如何使用这些库 完成数据分析的整个流程。课程中也会包含一些实际的案例,通过这些案例能够更好的掌握数据分 析相关技术。课程中大部分内容都以实践操作为主,涉及纯理论的环节并不太多。课程的重点在于 各种数据分析库的基本用法,综合运行这些库进行数据分析是课程的难点。本课程采用课堂讲授与 练习相结合的教学方法,课程成绩由考勤、课后作业完成情况以及期末成绩构成。另外,课程不包 含 Python 基础语法的介绍,选择该课程之前必须修过 Python 基础语法相关课程或者自学过相关 内容。 *课程简介 (Description) In the information age, massive data sets are formed by geometrically increasing data. How to find valuable information from these data becomes very important. Big data and data analysis technology have become a very important part of information technology. With the continuous development of Internet+, data analysis technology can play a certain role in all industries. Socialism with Chinese characteristics has entered a new era, and a new journey has begun to realize the Chinese dream of the great rejuvenation of the Chinese nation. The Party Central Committee decided to implement the national big data strategy, sounding the clarion call to accelerate the development of the digital economy and build a digital China. In his important speech at the second collective study of the Political Bureau of the 19th CPC Central Committee, General Secretary Xi Jinping pointed out that "big data is a new stage of informatization development", and made "promoting the innovation and development of the big data technology industry
building a The strategic deployment ofthe digital economy with dataas thekey element,the useof bigdatato improvethe level of national governance modernization, theuse ofbigdatatopromotetheprotectionandimprovementofpeople'slivelihood,andtheeffectiveprotectionof nationaldata securityhaspointedoutthedirectionformy countryto build a newnational comprehensive competitive advantage in theera of big data..In recent years, Python has become the programming language of choice for learningdata analysis.First of all,thePython languageis simpleand easytouse,with a lowlearningthreshold,andisveryfriendlytonon-computerprofessionals;secondlyPythonhasmanypowerful third-party libraries,whichcan coverdataacquisition,data cleaning,data visualization,and data mining in data analysis.,machine learning and other links, isaveritablefull-stack languagefordataanalysis.Themaincontentofthiscourse ishowtousePython for dataanalysis,including the useofthemost useddata analysis librariessuchasNumPy.pandas,matplotlib,pyecharts,andscikit-learn,andhowtousetheselibrariestocompletetheentireprocessofdataanalysis.Thecoursewill also include somepractical cases,throughwhichyoucanbettermasterdataanalysis relatedtechniques.Most of the content in the course is mainly based on practical operation,and there arenottoomanylinks involvingpuretheory.Thefocusof thecourse is onthebasic usage ofvarious dataanalysis libraries.The difficulty of thecourse is to comprehensively run theselibrariesfordataanalysis.Thiscourseadopts ateachingmethodthat combinesclassroomlecturesand exercises.Thecoursegrades arecomposedofattendance,homeworkcompletionandfinalgrades.Inaddition,thecoursedoesnotincludeanintroductionto thebasic Python grammar.Before choosing this course,youmusthavetaken a Python basic grammar related course or self-taught related content.*教材《Python数据科学手册》,作者[美]杰克·万托布拉斯(JakeVanderPlas)出版社:人民邮电出版社(Textbooks)出版时间:2018年02月,版次1,国际标准书号ISBN:9787115475893。参考资料(OtherReferences)*课程类别口公共基础课/全校公共必修课口通识教育课口专业基础课(Course Category)口专业核心课/专业必修课口专业拓展课/专业选修课口其他口线上,教学平台*授课对象*授课模式全校本科生线下口混合式口其他(Target Students)(Mode of Instruction)口实践类(70%以上学时深入基层)*授课语言口中文*开课院系口全外语计算机教研部(Language of口双语:中文+(School)(外语讲授不低于50%)Instruction)徐卫克,1980年生,男,中国社会科学院大学计算机教研部教师,*授课教师信息课程负责人计算社会科学研究中心成员,主要研究方向为数据分析、人工智(Teacher姓名及简介能。教授课程有《大学计算机》、《Python数据分析》、《PythonInformation)深度学习》、《Python编程导论》、《数据获取与网络爬虫》等
building a The strategic deployment of the digital economy with data as the key element, the use of big data to improve the level of national governance modernization, the use of big data to promote the protection and improvement of people's livelihood, and the effective protection of national data security has pointed out the direction for my country to build a new national comprehensive competitive advantage in the era of big data. . In recent years, Python has become the programming language of choice for learning data analysis. First of all, the Python language is simple and easy to use, with a low learning threshold, and is very friendly to non-computer professionals; secondly, Python has many powerful third-party libraries, which can cover data acquisition, data cleaning, data visualization, and data mining in data analysis. , machine learning and other links, is a veritable full-stack language for data analysis. The main content of this course is how to use Python for data analysis, including the use of the most used data analysis libraries such as NumPy, pandas, matplotlib, pyecharts, and scikit-learn, and how to use these libraries to complete the entire process of data analysis. The course will also include some practical cases, through which you can better master data analysis related techniques. Most of the content in the course is mainly based on practical operation, and there are not too many links involving pure theory. The focus of the course is on the basic usage of various data analysis libraries. The difficulty of the course is to comprehensively run these libraries for data analysis. This course adopts a teaching method that combines classroom lectures and exercises. The course grades are composed of attendance, homework completion and final grades. In addition, the course does not include an introduction to the basic Python grammar. Before choosing this course, you must have taken a Python basic grammar related course or self-taught related content. *教材 (Textbooks) 《Python 数据科学手册》,作者:[美]杰克·万托布拉斯(Jake VanderPlas)出版社:人民邮电出版社 出版时间:2018 年 02 月,版次 1,国际标准书号 ISBN:9787115475893。 参考资料 ( Other References) *课程类别 (Course Category) 公共基础课/全校公共必修课 通识教育课 专业基础课 专业核心课/专业必修课 专业拓展课/专业选修课 其他 *授课对象 (Target Students) 全校本科生 *授课模式 (Mode of Instruction) 线上,教学平台 线下 混合式 其他 实践类(70%以上学时深入基层) *开课院系 (School) 计算机教研部 *授课语言 (Language of Instruction) 中文 全外语 双语:中文+ (外语讲授不低于 50%) *授课教师信息 (Teacher Information) 课程负责人 姓名及简介 徐卫克,1980 年生,男,中国社会科学院大学计算机教研部教师, 计算社会科学研究中心成员,主要研究方向为数据分析、人工智 能。教授课程有《大学计算机》、《Python 数据分析》、《Python 深度学习》、《Python 编程导论》、《数据获取与网络爬虫》等
团队成员姓名及简介学会搭建数据分析开发环境;1.2.了解NumPy库的基本用法;3.熟练掌握Pandas库的基本操作学习目标4.了解和掌握数据处理常用操作(Learning5.掌握matplotlib、seaborn等可视化库的用法;Outcomes)6.了解时间序列数据分析的基本方法;7.掌握使用Python进行简单统计分析;8.了解使用scikit-learn库进行机器学习。*考核方式平时成绩30%,期末成绩70%(Grading)*课程教学计划(TeachingPlan)其中周教学内容摘要课其实习周次学讲程他(必含章节名称、讲述的内容提要、实验的名称、教学方法、课堂讨论的题验题时授讨环目、阅读文献参考书目及作业等)课课论节教学方法:讲授和案例教学。第一章Python数据分析简介1.1数据分析流程简介1.2本机环境配置第一周331.3线上环境配置1.4JupyterNotebook启动及使用1.5Python123环境介绍案例:数据分析入门案例一泰坦尼克教学方法:讲授和案例教学。第二章Numpy2.1多维数组2.2索引与切片第二周332.3数组的运算2.4数组的存取案例:图片像素修改求解线性方程组教学方法:讲授和案例教学。第三章pandas3.1基本数据结构3.2基本操作第三周333.3运算3.4层次化索引3.5可视化案例:探索Pokemon数据
团队成员 姓名及简介 学习目标 ( Learning Outcomes) 1. 学会搭建数据分析开发环境; 2. 了解 NumPy 库的基本用法; 3. 熟练掌握 Pandas 库的基本操作; 4. 了解和掌握数据处理常用操作; 5. 掌握 matplotlib、seaborn 等可视化库的用法; 6. 了解时间序列数据分析的基本方法; 7. 掌握使用 Python 进行简单统计分析; 8. 了解使用 scikit-learn 库进行机器学习。 *考核方式 (Grading) 平时成绩 30%,期末成绩 70% *课程教学计划(Teaching Plan) 周次 周 学 时 其中 教学内容摘要 (必含章节名称、讲述的内容提要、实验的名称、教学方法、课堂讨论的题 目、阅读文献参考书目及作业等) 讲 授 实 验 课 习 题 课 课 程 讨 论 其 他 环 节 第一周 3 3 教学方法:讲授和案例教学。 第一章 Python 数据分析简介 1.1 数据分析流程简介 1.2 本机环境配置 1.3 线上环境配置 1.4 Jupyter Notebook 启动及使用 1.5 Python123 环境介绍 案例:数据分析入门案例—泰坦尼克 第二周 3 3 教学方法:讲授和案例教学。 第二章 Numpy 2.1 多维数组 2.2 索引与切片 2.3 数组的运算 2.4 数组的存取 案例:图片像素修改 求解线性方程组 第三周 3 3 教学方法:讲授和案例教学。 第三章 pandas 3.1 基本数据结构 3.2 基本操作 3.3 运算 3.4 层次化索引 3.5 可视化 案例:探索 Pokemon 数据
探索Chipotle快餐数据数据分析流程california房价数据展示教学方法:讲授和案例教学。第四章数据读取与存储4.1CSV文件4.2 txt文件第四周334.3JSON文件4.4Excel文件案例:出生人口姓名性别统计随机漫步数据分析探索2012欧洲杯数据教学方法:讲授和案例教学。第五章数据清洗与整理5.1数据清洗第五周335.2数据合并与重排案例:鸢尾花数据清洗探索Iris鸢尾花数据探索虚拟姓名数据教学方法:讲授和案例教学。第六章数据分组与聚合6.1分组6.2聚合第六周336.3分组运算6.4数据透视表案例:公务员工资数据分析探索酒类消费数据探索风速数据教学方法:讲授和案例教学。第七章matplotlib可视化7.1线形图7.2柱状图第七周37.3其它基本图表37.4自定义设置案例:星巴克店铺数据分析宝可梦图表展示泰坦尼克数据探索教学方法:讲授和案例教学。第八章seaborn可视化8.1样式与分布图第八周338.2分类图8.3回归图与网格第九章pyecharts可视化9.1基础图表
探索 Chipotle 快餐数据 数据分析流程 california 房价数据展示 第四周 3 3 教学方法:讲授和案例教学。 第四章 数据读取与存储 4.1 CSV 文件 4.2 txt 文件 4.3 JSON 文件 4.4 Excel 文件 案例:出生人口姓名性别统计 随机漫步数据分析 探索 2012 欧洲杯数据 第五周 3 3 教学方法:讲授和案例教学。 第五章 数据清洗与整理 5.1 数据清洗 5.2 数据合并与重排 案例:鸢尾花数据清洗 探索 Iris 鸢尾花数据 探索虚拟姓名数据 第六周 3 3 教学方法:讲授和案例教学。 第六章 数据分组与聚合 6.1 分组 6.2 聚合 6.3 分组运算 6.4 数据透视表 案例:公务员工资数据分析 探索酒类消费数据 探索风速数据 第七周 3 3 教学方法:讲授和案例教学。 第七章 matplotlib 可视化 7.1 线形图 7.2 柱状图 7.3 其它基本图表 7.4 自定义设置 案例:星巴克店铺数据分析 宝可梦图表展示 泰坦尼克数据探索 第八周 3 3 教学方法:讲授和案例教学。 第八章 seaborn 可视化 8.1 样式与分布图 8.2 分类图 8.3 回归图与网格 第九章 pyecharts 可视化 9.1 基础图表
9.2其他图表案例:泰坦尼克号seaborn绘图数据特征分析航空公司客户价值分析模事百科数据分析荔枝数据分析教学方法:讲授和案例教学。第十章时间序列10.1datetime模块10.2时间序列基础10.3日期第九周3310.4时期10.5频率转换与重采用案例:自行车租赁数据分析探索美国犯罪数据探索Apple公司股价数据TushareAPI介绍教学方法:讲授和案例教学。第十一章统计分析基础11.1 统计量11.2统计分布第十周3311.3统计推断11.4相关性分析案例:回归分析数据特征分析教学方法:讲授和案例教学。第十二章机器学习12.1简介12.2分类12.3回归第十一周2212.4聚类案例:共享单车需求分析估算boston房屋价格手写数字识别总计3232备注(Notes)
9.2 其他图表 案例:泰坦尼克号 seaborn 绘图 数据特征分析 航空公司客户价值分析 糗事百科数据分析 荔枝数据分析 第九周 3 3 教学方法:讲授和案例教学。 第十章 时间序列 10.1 datetime 模块 10.2 时间序列基础 10.3 日期 10.4 时期 10.5 频率转换与重采用 案例:自行车租赁数据分析 探索美国犯罪数据 探索 Apple 公司股价数据 Tushare API 介绍 第十周 3 3 教学方法:讲授和案例教学。 第十一章 统计分析基础 11.1 统计量 11.2 统计分布 11.3 统计推断 11.4 相关性分析 案例: 回归分析 数据特征分析 第十一周 2 2 教学方法:讲授和案例教学。 第十二章 机器学习 12.1 简介 12.2 分类 12.3 回归 12.4 聚类 案例: 共享单车需求分析 估算 boston 房屋价格 手写数字识别 总计 32 32 备注(Notes)