美文网首页
R语言技巧每日分享day10-base R的字符串常用函数

R语言技巧每日分享day10-base R的字符串常用函数

作者: 江湾青年 | 来源:发表于2023-03-01 10:28 被阅读0次
  1. nchar(x):统计字符串长度,x可为向量。
> nchar('123456')
[1] 6
  1. substr(x, start, stop):字符串截取子集,前闭后闭,x可为向量。
> substr('123456',start = 2,stop = 4)
[1] "234"
  1. strsplit(x, split):按照split分割x,返回的是一个长度与x相同的list。
> a
[1] "1Naive T cells1=2CD4n T2=3CD4.Naive3=4CD4 Naive4=5CD4_naive5"
[2] "1Activated CD4 T cells1=2CD4m T2=3CD4.EM3=4CD4 TCM4=5Th25"   
> strsplit(a,'=')
[[1]]
[1] "1Naive T cells1" "2CD4n T2"        "3CD4.Naive3"     "4CD4 Naive4"     "5CD4_naive5"    

[[2]]
[1] "1Activated CD4 T cells1" "2CD4m T2"                "3CD4.EM3"               
[4] "4CD4 TCM4"               "5Th25"                  
  1. sub(pattern, replacement, x)gsub():替换字符串。 sub()gsub()的不同点在于,sub只替换第一个匹配的字符,而gsub匹配所有的。一般来说,gsub更为常用。
> x <- "dddddddwerxd"
> sub("d","M",x)
[1] "Mddddddwerxd"
> gsub("d","M",x)
[1] "MMMMMMMwerxM"
  1. grep(pattern, x):查找x中包含pattern的元素所在的位置
    grepl(pattern, x):判断x是否包含pattern,返回的是逻辑向量
> x <- c("d", "a", "c", "abba")  
> grep("a", x)
[1] 2 4
> grepl("a", x)   
[1] FALSE  TRUE FALSE  TRUE
  1. agrep(pattern, x, max.distance = 0.1)agrepl(pattern, x, max.distance = 0.1):模糊匹配
> x <- c("approximately")  
> grepl("approximate", x)
[1] TRUE
  • 以上所有很多函数都包含一个参数pattern,它通常是一个正则表达式,关于正则表达式的用法,我们放在后面单独讲。

参考

https://www.cnblogs.com/liujiaxin2018/p/14696562.html

相关文章

网友评论

      本文标题:R语言技巧每日分享day10-base R的字符串常用函数

      本文链接:https://www.haomeiwen.com/subject/bvpnkdtx.html