当前位置：和泉文库 > 计算机 > 浏览文档

《Python数据分析》课程电子教案（PPT课件）第5章 Pandas数据载入与预处理

文件格式：PPTX，文件大小：1.07MB，售价：11.6元

文档详细内容（约52页）

5.1数据载入表5-1readtable和readcsv常用参数及其说明说明参数名称filepath接收string，代表文件路径，无默认接收string，代表分隔符。readcsv默认为"”，read_table默认为制表符sep“”，如果分隔符指定错误，在读取数据的时候，每一行数据将连成一片接收int或sequence，表示将某行数据作为列名，默认为infer，表示自header动识别接收array，表示列名，默认为Nonenames接收int、sequence或False，表示索引列的位置，取值为sequence则代index_col表多重索引，默认为None接收dict，代表写入的数据类型（列名为key，数据格式为values），默dtype认为Noneengine接收c或者python，代表数据解析引擎，默认为c接收int，表示读取前n行，默认为Nonenrows

5.1 数据载入参数名称说明 filepath 接收string，代表文件路径，无默认 sep 接收string，代表分隔符。read_csv默认为“,”，read_table默认为制表符 “\t”，如果分隔符指定错误，在读取数据的时候，每一行数据将连成一片 header 接收int或sequence，表示将某行数据作为列名，默认为infer，表示自动识别 names 接收array，表示列名，默认为None index_col 接收int、sequence或False，表示索引列的位置，取值为sequence则代表多重索引，默认为None dtype 接收dict，代表写入的数据类型（列名为key，数据格式为values），默认为None engine 接收c或者python，代表数据解析引擎，默认为c nrows 接收int，表示读取前n行，默认为None 表5-1 read_table和read_csv常用参数及其说明

5.1数据载入【例5-1】使用readcsv函数读取CsV文件。In[1]:edfl=pd.readcsv（“文件路径文件名'）+#读取CSV文件到DataFrame中df2=pd.readtable（“文件路径文件名，sep=‘）#使用readtable，并指定分隔符df3=pd.read_csv（“文件路径文件名"，names=["a,"b',---]）#文件不包含表头行，允许自动分配默认列名，也可以指定列名

5.1 数据载入

5.1数据载入2.文本文件的存储文本文件的存储和读取类似，结构化数据可以通过pandas中的to csv函数实现以CSV文件格式存储文件。DataFrame.to_csv(path_or_buf = None, sep =',, na_rep,columns=None,header=True, index=True, index label=None,mode='w, encoding=None)

2. 文本文件的存储文本文件的存储和读取类似，结构化数据可以通过pandas中的to_csv函数实现以CSV文件格式存储文件。 DataFrame.to_csv(path_or_buf = None, sep = ’,’, na_rep, columns=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 5.1 数据载入

5.1数据载入·5.1.2读/写Excel文件1.Excel文件的读取Pandas提供了readexcel函数读取“xls”和“xlsx"两种excel文件其格式为：pandas.read_excel(io, sheetname, header=O, index_col=None,names=None, dtype)readexcel函数和readtable函数的部分参数相同

• 5.1.2 读/写Excel文件 1. Excel文件的读取 Pandas提供了read_excel函数读取“xls”和“xlsx”两种excel文件，其格式为： pandas.read_excel(io, sheetname, header=0, index_col=None, names=None, dtype) read_excel函数和read_table函数的部分参数相同 5.1 数据载入

5.1数据载入表5-2Pandas读写Excel文件说明参数名称io接收string，表示文件路径，无默认sheetname接收string、int，代表excel表内数据的分表位置，默认为o接收int或sequence，表示将某行数据作为列名，默认为infer，表示自header动识别接收int、sequence或者False，表示索引列的位置，取值为sequencenames则代表多重索引，默认为None接收int、sequence或者False，表示索引列的位置，取值为sequenceindex col则代表多重索引，默认为None接收dict，代表写入的数据类型（列名为key，数据格式为values），dtype默认为None

表5-2 Pandas读写Excel文件参数名称说明 io 接收string，表示文件路径，无默认 sheetname 接收string、int，代表excel表内数据的分表位置，默认为0 header 接收int或sequence，表示将某行数据作为列名，默认为infer，表示自动识别 names 接收int、sequence或者False，表示索引列的位置，取值为sequence 则代表多重索引，默认为None index_col 接收int、sequence或者False，表示索引列的位置，取值为sequence 则代表多重索引，默认为None dtype 接收dict，代表写入的数据类型（列名为key，数据格式为values），默认为None 5.1 数据载入

点击进入文档下载页（PPTX格式）

共52页，可试读18页，点击继续阅读 ↓↓

您可能感兴趣的文档

《Python数据分析》课程电子教案（PPT课件）第4章 pandas统计分析基础
《Python数据分析》课程电子教案（PPT课件）第3章 NumPy数值计算基础
《Python数据分析》课程电子教案（PPT课件）第2章 Python编程基础
《Python数据分析》课程电子教案（PPT课件）第1章数据分析与可视化概述新
河池学院：《数据结构》课程电子教案（PPT教学课件）第10章排序 10.8 外排序
河池学院：《数据结构》课程电子教案（PPT教学课件）第10章排序 10.5 归并排序 10.6 基数排序 10.7 各种内排序方法的比较和选择
河池学院：《数据结构》课程电子教案（PPT教学课件）第10章排序 10.4 选择排序
河池学院：《数据结构》课程电子教案（PPT教学课件）第10章排序 10.1 排序的基本概念 10.2 插入排序 10.3 交换排序
河池学院：《数据结构》课程电子教案（PPT教学课件）第9章查找 9.4 哈希表查找
河池学院：《数据结构》课程电子教案（PPT教学课件）第9章查找 9.3 树表的查找（2/2）
河池学院：《数据结构》课程电子教案（PPT教学课件）第9章查找 9.3 树表的查找（1/2）
河池学院：《数据结构》课程电子教案（PPT教学课件）第9章查找 9.1 查找的基本概念 9.2 线性表的查找
《Python数据分析》课程电子教案（PPT课件）第6章 Matplotlib数据可视化基础
《Python数据分析》课程电子教案（PPT课件）第7章利用Seaborn绘图
《Python数据分析》课程电子教案（PPT课件）第8章 pyecharts可视化
《Python数据分析》课程电子教案（PPT课件）第9章时间序列数据分析
《Python数据分析》课程电子教案（PPT课件）第10章 SciPy科学计算
《R语言》课程教学资源（PPT课件）第01章进入R的世界
《R语言》课程教学资源（PPT课件）第02章 R语言基础
《R语言》课程教学资源（PPT课件）第03章 R函数与流程控制
《R语言》课程教学资源（PPT课件）第04章
《R语言》课程教学资源（PPT课件）第05章基本图形
《R语言》课程教学资源（PPT课件）第06章数据预处理
《R语言》课程教学资源（PPT课件）第07章数据处理与描述性统计

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录