美文网首页R语言学习R语言
R语言match函数的应用举例

R语言match函数的应用举例

作者: PhageNanoenzyme | 来源:发表于2021-01-10 00:13 被阅读0次

    数据筛选是在分析中最常用的步骤,如数据挖掘分析中,从TCGA或GEO得到的表达矩阵要不断筛选,来进行数据整理。
    match函数是生信技能树生信爆款入门课程R语言部分的讲到的一个重要知识点。
    为加深理解,现在找一个数据集做下练习巩固。

    官方说明文档:

    match
    match:匹配两个向量,返回第二个向量在第一个向量匹配位置的下标值。
    match函数使用格式有如下两种:
    第一种方便设置参数,返回x中元素在table中的位置
    match(x, table, nomatch = NA_integer_, incomparables = NULL)
    第二种简洁,返回x中每个元素在table中是否存在
    x %in% table

    参数详解

    x: 向量, 要匹配的值;
    table: 向量, 被匹配的值;
    nomatch: 没匹配上的返回值, 必须是整数;
    incomparables: 指定不能用来匹配的值.
    

    match函数是一个完全匹配函数, 当两个元素类型不一样时, 如果进行类型转换后匹配得上的话, 则仍可匹配, 可看下例.

    match(c(1, "TRUE"), c(T, 0, "1"))
    返回3 1,
    即1位于表中的3号位,TRUE位于1号位,且T和TRUE可匹配成功
    
    c(1, "TRUE", F) %in% c(T, 0, "1")
    返回TRUE TRUE FALSE,
    表示每个元素在table中是否存在
    

    举例练习如下:

    生成测试数据:
    library(tidyverse)
    diamonds
    > x <- colnames(diamonds)[1:5]
    > x
    [1] "carat"   "cut"     "color"   "clarity" "depth"  
    > y <- colnames(diamonds)[1:10]
    > y
     [1] "carat"   "cut"     "color"   "clarity" "depth"   "table"   "price"   "x"       "y"      
    [10] "z"      
    > z <- colnames(diamonds)[seq(1,10,2)]
    > z
    [1] "carat" "color" "depth" "price" "y"    
    

    1.使用match函数找出x中每个元素在y中的位置

    > match(x,y)
    [1] 1 2 3 4 5
    

    2.使用match函数找出y中每个元素在x中的位置

    > match(y,x)
     [1]  1  2  3  4  5 NA NA NA NA NA
    
    

    3.判断z中的元素是否都在x中

    > z %in% x
    [1]  TRUE  TRUE  TRUE FALSE FALSE
    

    4.z中元素都在y的什么位置?

    > match(z,y)
    [1] 1 3 5 7 9
    

    5.z中有多少个元素在y中?

     sum(z %in% y)
    [1] 5
    

    6.挑出y里面有z中没有的数值。

     y[-match(z,y)]
    [1] "cut"     "clarity" "table"   "x"       "z"      
    

    7.x和z中有几个相同元素?,都是哪些元素?

    > sum(x %in% z)
    [1] 3
    > z[x %in% z]
    [1] "carat" "depth" "y"   
    

    8.z中和y相同的元素都有哪些?

    > y[match(z,y)]
    [1] "carat" "color" "depth" "price" "y"    
    

    9.x和z中相同的元素都有哪些?

    > x[x %in% z]
    [1] "carat" "color" "depth"
    

    10.使用match删除y中与z重复的值

    > y[-match(z,y)]
    [1] "cut"     "clarity" "table"   "x"       "z"      
    

    参考
    R语言:数据筛选match

    相关文章

      网友评论

        本文标题:R语言match函数的应用举例

        本文链接:https://www.haomeiwen.com/subject/cgocaktx.html