第6章数据预处理
第6章 数据预处理
本章学习目标1.掌握R语言中的字符串处理2.掌握R语言中日期和时间的处理3.学会对内置数据集中的数据做初步清洗
本章学习目标 1. 掌握R语言中的字符串处理 2. 掌握R语言中日期和时间的处理 3. 学会对内置数据集中的数据做初步清洗
1.字符串分割2.字符串拼接3.字符串长度计算4.字符串截取6.1字符串的处理5.字符串替换6.字符串大小写替换7.字符串匹配8.字符串格式化输出
6.1 字符串的处理 1. 字符串分割 2. 字符串拼接 3. 字符串长度计算 4. 字符串截取 5. 字符串替换 6. 字符串大小写替换 7. 字符串匹配 8. 字符串格式化输出
6.1字符串的处理1.字符串分割本书中使用strsplit()函数来实现分割字符串。strsplit()函数的语法结构是:strsplit(x,Split,fixed=FALSE,perl=FALSE,useBytes=FALSE)①参数x:参数x是需要函数来处理的字符串格式的向量。②参数split:为拆分位置的字串向量,即在哪个字串处开始拆分。该参数默认是正则表达式匹配。③参数fixed:若设置fixed=TURE则表示是用普通文本匹配或者正则表达式的精确匹配。④参数perl:表示可以使用perl语言里面的正则表达式。③参数useByteS:表示是否逐字节进行匹配,默认为FALSE,表示是按字符匹配而不是按字节进行匹配注意:strsplit()函数中的必要参数是x,split两个参数,其它参数不是必要参数
6.1 字符串的处理 1. 字符串分割 本书中使用strsplit( )函数来实现分割字符串。 strsplit( )函数的语法结构是: strsplit(x,split,fixed= FALSE,perl= FALSE,useBytes= FALSE) ①参数x:参数x是需要函数来处理的字符串格式的向量。 ②参数split:为拆分位置的字串向量,即在哪个字串处开始拆分。该参数默认是正则表达式匹配。 ③参数fixed:若设置fixed= TURE则表示是用普通文本匹配或者正则表达式的精确匹配。 ④参数perl:表示可以使用perl语言里面的正则表达式。 ⑤参数useBytes:表示是否逐字节进行匹配,默认为FALSE,表示是按字符匹配而不是按字节进行匹配。 注意:strsplit( )函数中的必要参数是x,split两个参数,其它参数不是必要参数
常用符号及含义符号含义转义字符除了换行以外的任意字符A放在句首,表示一行字符串的起始$放在句尾,表示一行字符串的结束零个或者多个之前的字符+一个或者多个之前的字符?零个或者一个之前的字符配其中任何一个字符,而在中代表“非”,代表之间或者,小括号(与花括号0配合“使用1