美文网首页R语言
R学习笔记(1):几个小知识点

R学习笔记(1):几个小知识点

作者: TOP生物信息 | 来源:发表于2019-02-12 23:51 被阅读3次

    查看或更改R包的存储路径
    创建连续数值的向量
    创建矩阵
    is. & as.系列函数
    数据导入,导出
    挑选符合条件的行记录
    read.table(comment.char="!")
    行名rownames()
    数据框的简单统计
    写一个函数
    左右合并两个数据框

    查看或更改R包的存储路径

    #查看
    > .libPaths()
    [1] "E:/LINUXlearning/learning/R/R-3.5/R-3.5.1/library"
    
    #更改
    .libPaths("文件夹路径")
    #或
    install.packages("包",lib="文件夹路径")
    

    创建连续数值的向量

    a = 1:10
    b = seq(1,10)
    c = seq(1,10,2)
    

    创建矩阵

    # dim()改变维度
    > x <- 1:12 ; dim(x) <- c(3,4)
    > x
         [,1] [,2] [,3] [,4]
    [1,]    1    4    7   10
    [2,]    2    5    8   11
    [3,]    3    6    9   12
    

    is. & as.系列函数

    #is.系列函数,判断变量是否为某种类型,返回布尔值
    > is.matrix(x)
    [1] TRUE
    #as.系列函数,转换变量类型,并返回变量
    > y <- as.data.frame(x)
    > y
      V1 V2 V3 V4 #数据框有行列名,没有设置行列名也会自动加上
    1  1  4  7 10
    2  2  5  8 11
    3  3  6  9 12
    > str(y) #查看内部结构
    'data.frame':   3 obs. of  4 variables:
     $ V1: int  1 2 3
     $ V2: int  4 5 6
     $ V3: int  7 8 9
     $ V4: int  10 11 12
    
    #与矩阵x的对比
    > x
         [,1] [,2] [,3] [,4]
    [1,]    1    4    7   10
    [2,]    2    5    8   11
    [3,]    3    6    9   12
    > str(x)
     int [1:3, 1:4] 1 2 3 4 5 6 7 8 9 10 ...
    

    数据导入,导出

    #把RStudio编辑界面中的变量导出来
    save(y,file = "y.Rdata")
    #将外部数据导入
    load(file = "y.Rdata")
    
    write.csv(数据框变量,“名称.csv”)
    read.csv(“名称.csv”)
    
    还有read.xxx系列
    

    对于数据框的某一列,如何针对该列挑选出符合条件的行记录

    #以"grep"为例
    index1=grep("W-type",data_f$V1) #返回索引
    index2=grepL("W-type",data_f$V1) #返回布尔值
    wanted=data_f[index1,]
    wanted=data_f[index2,]
    
    #还有filter函数
    

    read.table(comment.char="!")这个参数指定注释行的开头字符

    read.table("GSE17215_series_matrix.txt",comment.char = "!",sep = "\t",header = T,row.names=1)
    

    指定某一列为行名后,删除该列

    rownames(数据框变量)=数据框变量[,1]
    数据框变量=数据框变量[,-1]
    

    数据框的简单统计

    max(b$GSM431121)
    min(b$GSM431121)
    fivenum(b$GSM431121) #最大、最小及四分位数
    table(b$GSM431121 > 10000) #统计>10000和<=10000各有多少
    
    > mean(a[1,])
    [1] NA
    Warning message:
    In mean.default(a[1, ]) : 参数不是数值也不是逻辑值:回覆NA
    > mean(as.numeric(a[1,]))
    [1] 1955.593
    #原因如下,数据框不能直接求均值
    > str(a[1,])
    'data.frame':   1 obs. of  6 variables:
     $ GSM431121: num 482
     $ GSM431122: num 597
     $ GSM431123: num 2722
     $ GSM431124: num 2566
     $ GSM431125: num 2738
     $ GSM431126: num 2629
    > str(as.numeric(a[1,]))
     num [1:6] 482 597 2722 2566 2738 ...
    
    #求行均值
    ##简单方法
    rowMeans(a)
    ##for循环
    for (i in 1:nrow(a)) {
      print(mean(as.numeric(a[i,])))
    }
    ##第三种,x表示as.numeric(a[i,])
    apply(a,1,function(x){
      mean(x)
    })
    ##第四种
    apply(a,1,mean)
    
    #同理,求最大值
    for (i in 1:nrow(a)) {
      print(max(as.numeric(a[i,])))
    }
    ##
    apply(a,1,function(x){
      max(x)
    })
    ##
    apply(a,1,max)
    

    写一个函数

    hsy <- function(x){
      for (i in 1:nrow(x)) {
        a=as.numeric(x[i,])
        b=a[1]+a[2]
        print(b)
      }
    }
    hsy(a)
    

    左右合并两个数据框

    cbind(a1,a2)
    

    这一部分的学习内容来源于生信技能树,在此表示感谢!!!

    相关文章

      网友评论

        本文标题:R学习笔记(1):几个小知识点

        本文链接:https://www.haomeiwen.com/subject/dejusqtx.html