当前位置：和泉文库 > 计算机 > 浏览文档

《R语言》课程教学资源（PPT课件）第07章数据处理与描述性统计

1. 掌握apply函数族的应用 2. 掌握如何对清理过的数据进行处理 3. 学会利用R语言对数据做描述性统计

文件格式：PPTX，文件大小：126.87KB，售价：9.12元

文档详细内容（约40页）

7.1apply函数族2.lapply()函数(P144)lapply(）函数是循环操作函数之一，用来对list类型、data.frame类型数据集进行循环，并返回和x长度同样的list结构作为结果数据集，它和apply(）函数表面上的区别是以字母“I”开头，就可以判断lapply()函数和apply()函数主要区别在于返回结果数据集的类型。函数语法格式：lapply(X， FUN,...)参数列表：①X：list类型、data.frame类型的数据集合。②FUN：自定义函数。③·更多参数

7.1 apply函数族 2. lapply( )函数 (P144) lapply( )函数是循环操作函数之一，用来对list类型、data.frame类型数据集进行循环，并返回和X长度同样的list结构作为结果数据集，它和apply( )函数表面上的区别是以字母“l” 开头，就可以判断lapply( )函数和apply( )函数主要区别在于返回结果数据集的类型。函数语法格式： lapply(X， FUN， .) 参数列表： ① X：list类型、data.frame类型的数据集合。 ② FUN：自定义函数。 ③ .：更多参数

7.1apply函数族【例7-1】计算list中的每个key对应的数据的分位数。（P144）#分别计算每个KEY对应该的数据的分位数。#构建一个list数据集x,分别包括a,b,c三个key值>lapply(x,quantile)Sa>x<- list(a = 1:10, b = rnorm(6,6,2),C=C(TRUE,FALSE,FALSE,TRUE,FALSE)0%25%50%75%100%>x1.003.255.507.7510.00Sa$b[1] 1 2 3 4 5 6 7 8 9 100%25%50%75%100%$b4.2944095.1723347.4256098.38050310.430921[1] 4.685836 4.294409 6.6318308.219388Sc10.4309218.4342070%25%50%75%100%Sc00011[1]TRUEFALSEFALSETRUEFALSE

# 构建一个list数据集x,分别包括a,b,c三个key值｡ > x <- list(a = 1:10, b = rnorm(6,6,2), c= c(TRUE,FALSE,FALSE,TRUE,FALSE)) > x $a [1] 1 2 3 4 5 6 7 8 9 10 $b [1] 4.685836 4.294409 6.631830 8.219388 10.430921 8.434207 $c [1] TRUE FALSE FALSE TRUE FALSE 【例7-1】计算list中的每个key对应的数据的分位数。（P144） 7.1 apply函数族 # 分别计算每个KEY对应该的数据的分位数｡ > lapply(x,quantile) $a 0% 25% 50% 75% 100% 1.00 3.25 5.50 7.75 10.00 $b 0% 25% 50% 75% 100% 4.294409 5.172334 7.425609 8.380503 10.430921 $c 0% 25% 50% 75% 100% 0 0 0 1 1

7.1apply函数族【例7-2】对数据框的列求和。注意：>x<- cbind(x1 = 5, x2 = c(1:6))优点：lapply()函数可以很方便地把list数据集进行循>lapply(data.frame(x),sum)环操作，lapply）函数还可以用于对data.frame数据$x1集按列进行循环操作。[1] 30不足：但它不能像apply()函数那样对向量或矩阵对$x2象进行循环操作。[1]21

> x <- cbind(x1 = 5, x2 = c(1:6)) > lapply(data.frame(x), sum) $x1 [1] 30 $x2 [1] 21 【例7-2】对数据框的列求和。 7.1 apply函数族注意：优点：lapply( )函数可以很方便地把list数据集进行循环操作，lapply( )函数还可以用于对data.frame数据集按列进行循环操作。不足：但它不能像apply( )函数那样对向量或矩阵对象进行循环操作

7.1apply函数族3.sapply(）函数（P145）sapply()函数与lapply(）函数作用相似，sapply(）函数只是在lapply()函数的基础上增加了simplify参数和USE.NAMES参数，主要就是优化了输出。Sapply(）函数在simplify参数和USE.NAMES参数都使用默认值的时候返回值为向量，这是和lapply(）函数的最大区别。函数语法格式：sapply(X,FUN,..,simplify=TRUE,USE.NAMES=TRUE)参数列表：①X：数组、矩阵、数据框。②FUN：自定义函数。③.：更多参数。④Simplify：是否数组化，默认值是TRUE，可以设置FALSE关闭数组化。比较特别的是它还有一个值是“array”，如果参数值设置为“array”，输出结果按数组进行分组。③USE.NAMES：默认值是TRUE，如果X的内容为字符串，那么如果没有名字就用X的内容中的字符传来命名，如果设置为FALSE则不去命名

7.1 apply函数族 3. sapply( )函数（P145） sapply( )函数与lapply( )函数作用相似，sapply( )函数只是在lapply( )函数的基础上增加了 simplify参数和USE.NAMES参数，主要就是优化了输出。Sapply( )函数在simplify参数和 USE.NAMES参数都使用默认值的时候返回值为向量，这是和lapply( )函数的最大区别。函数语法格式： sapply(X， FUN， .， simplify=TRUE， USE.NAMES = TRUE) 参数列表： ① X：数组、矩阵、数据框。 ② FUN：自定义函数。 ③ .：更多参数。 ④ Simplify：是否数组化，默认值是TRUE，可以设置FALSE关闭数组化。比较特别的是它还有一个值是“array”，如果参数值设置为“array”，输出结果按数组进行分组。 ⑤ USE.NAMES：默认值是TRUE，如果X的内容为字符串，那么如果没有名字就用X的内容中的字符传来命名，如果设置为FALSE则不去命名

7.1apply函数族【例7-3】使用sapply()函数来完成矩阵，数据框的计算需求。>x<- cbind(x1 = 5,x2 = c(1:6))#对矩阵计算注意：> sapply(x, sum)[1]555555123456如果simplify=FALSE和USE.NAMES=FALSE，即simplify#对数据框计算参数和USE.NAMES参数不使用默认值，那么sapply(）>sapply(data.frame(x),sum)x1x2函数就和lapply()函数一样了。3021>lapply(data.frame(x),sum)#检查结果类型,来取定sapply()函数返回类型为向量,而lapply(）函数返回类型为list>sapply(data.frame(x),sum,simplify=F,USE.NAMES=F)#列表>class(lapply(x,sum))[1] "list"#返回类型都是列表！>class(sapply(x, sum)#数值向量[1]"numeric

> x <- cbind(x1 = 5, x2 = c(1:6)) # 对矩阵计算 > sapply(x, sum) [1] 5 5 5 5 5 5 1 2 3 4 5 6 # 对数据框计算 > sapply(data.frame(x), sum) x1 x2 30 21 # 检查结果类型,来取定sapply( )函数返回类型为向量,而 lapply( )函数返回类型为list > class(lapply(x, sum)) # 列表 [1] “list” > class(sapply(x, sum)) # 数值向量 [1] “numeric” 【例7-3】使用sapply( )函数来完成矩阵，数据框的计算需求。 7.1 apply函数族注意：如果simplify=FALSE和USE.NAMES=FALSE，即simplify 参数和USE.NAMES参数不使用默认值，那么sapply( ) 函数就和lapply( )函数一样了。 > lapply(data.frame(x) , sum) > sapply(data.frame(x), sum, simplify=F , USE.NAMES = F) # 返回类型都是列表！

点击进入文档下载页（PPTX格式）

共40页，可试读14页，点击继续阅读 ↓↓

您可能感兴趣的文档

《R语言》课程教学资源（PPT课件）第06章数据预处理
《R语言》课程教学资源（PPT课件）第05章基本图形
《R语言》课程教学资源（PPT课件）第04章
《R语言》课程教学资源（PPT课件）第03章 R函数与流程控制
《R语言》课程教学资源（PPT课件）第02章 R语言基础
《R语言》课程教学资源（PPT课件）第01章进入R的世界
《Python数据分析》课程电子教案（PPT课件）第10章 SciPy科学计算
《Python数据分析》课程电子教案（PPT课件）第9章时间序列数据分析
《Python数据分析》课程电子教案（PPT课件）第8章 pyecharts可视化
《Python数据分析》课程电子教案（PPT课件）第7章利用Seaborn绘图
《Python数据分析》课程电子教案（PPT课件）第6章 Matplotlib数据可视化基础
《Python数据分析》课程电子教案（PPT课件）第5章 Pandas数据载入与预处理
沈阳师范大学：《高级语言程序设计Python》课程教学大纲 Programming of Computer Language（一）
沈阳师范大学：《高级语言程序设计Python》课程授课教案（2020讲义，共三章，授课教师：刘立群）
沈阳师范大学：《计算机控制技术》课程授课教案（电子信息工程专业，共九章，主讲教师：申海）
沈阳师范大学：《Web程序设计》课程授课教案（讲稿，授课教师：马佳琳）
《程序设计基础》课程教学资源（文献资料）INCITS/ISO/IEC 9899-2011[2012]（ISO/IEC 9899-2011, IDT）Information technology — Programming languages — C
《数据挖掘技术基础》课程教学资源（授课教案，适用专业：数据科学与大数据技术）
《数据挖掘技术基础》课程教学大纲（Fundamentals of Data Mining）
《大学计算机基础》课程教学课件（讲稿）第1章计算文化
《大学计算机基础》课程教学课件（讲稿）第2章计算基础
《大学计算机基础》课程教学课件（讲稿）第3章计算机硬件
《大学计算机基础》课程教学课件（PPT讲稿）第4章软件平台
《大学计算机基础》课程教学课件（PPT讲稿）第5章计算机网络

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录