学习小组Day5笔记-陶*

作者: 陶子不淘气 | 来源:发表于2020-11-13 19:15 被阅读0次

    今天的课好难呀,学的有点吃力。几个注意点:

    • ?read.table产看帮助文档
    • 1.理解元素、标量、向量的概念

    元素可以是数字、字符串、字母等,字符串要用英文状态下的双引号引起来;标量是指一个元素组成的变量;向量是指多个有序排列的元素组成的变量;

    补充:脚本窗口的打开:通常脚本窗口时隐藏的,可通过点击文件下拉菜单,选择“新建文件”-“R脚本”来打开此隐藏窗口。

    • 常用R语言

    x<- c(1,2,3)回车后出现 1 2 3,该命令意为将x定义为由元素1,2,3组成的向量。
    x<- 1:10 该命令意为从1-10之间所有的整数
    x<- seq(1,10,by = 0.5) 该命令意为1-10之间每隔0.5取一个数
    x<- rep(1:3,times=2) 该命令意为1-3之间所有的整数, 重复2次
    x[4] 第4个元素;x[2:4]第2到4个元素;
    x[-4]除了第4个元素之外剩余的元素
    x[-(2:4)]除了第2-4个元素;
    x[c(1,5)] 第1个和第5个元素;
    x[x==10] 等于10的元素; 这是2个等号哦;
    x[x<0]小于0的元素;
    x[x %in% c(1,2,5) a %in% table表示存在于table中的a;

    重要内容

    1.查看本地数据

    read.csv(file="XX.txt")是指将文件以数据框(表格)形式打开同时创建一个数据框;
    read.table(file="xxx.txt",seq=''\t'',header=T)表示将xxx.txt文件以数据框形式打开,各元素之间用空格分隔开(/t或者直接空格都一样),header=T表示是否将第一行作为列名,是选择T,false则第一行即为具体数据)。read.csv()函数默认为head=T。

    2.查看及修改行号、列数

    colnames(变量名)查看列名;
    rownames(变量名) 查看行名;
    colnames(X)[1]<-"haha" 将变量X第一列名称改为haha;
    row.names=1表示将第1列的元素作为行号;

    3.导出数据框

    write.table(X,file = "yu.txt",sep = ",",quote=F)将变量X相关元素导出为表格的形式,命名为yu.txt,各元素之间用,隔开,quote=F表示各字符串不加双引号,quote=T表示各字符串要加双引号,默认是quote=T的状态)

    4.数据的保存与重新加载

    save.image(file="taotao.RData ")意为将当前全部变量保存至taotao.RData文件,注意文件后缀为RData;
    save(X,file=" taotaoA.RData")将变量X保存为taotaoA.RData;
    load("taotao.RData")加载taotao.RData文件显示其数据;

    5.提取元素

    • X[x,y] 第x行第y列 X[x,] 第x行 X[,y] 第y列
    • X[y] #也是第y列;
    • X[a:b] 第a列到第b列
    • X[c(a,b)] 第a列和第b列
    • X$列名#也可以提取列(此时可以tab键自动补齐)

    注意:第5条是在变量X的状态下查看的,如果变量赋名为a,替换即可。

    6.直接使用数据框中的变量

    options(stringsAsFactors = T)
    a <-data.frame(case=paste0("S",1:9),values=runif(9))
    plot(a$case,a$values)
    环境设置函数为options(),stringsAsFactors=Fasle意思为防止导入数据任何因子的转换,=T则相反;
    paste0与paste函数,前者是指返回无空格的对象,具体可见20190506-R语言字符处理函数paste、paste0一文。例子可见:

    xx<-c("ac","bg")
    paste(xx,1:2)
    [1] "ac 1" "bg 2"
    paste0(xx,1:2)
    [1] "ac1" "bg2"

    不想多次输入变量名可使用下列方法(还是刚才那个变量a为例哈):

    • attach(a),plot(case,values)。做完后将a删除出搜索环境 detach(a)。这种方法的局限性:两个以上数据框的列名有冲突时,同时attach会报错。
    • 用with函数,我觉得没怎么懂

    最后,记得清除所有变量哈 rm(list = ls())

    文中代码引用自生信星球,在此感谢。

    相关文章

      网友评论

        本文标题:学习小组Day5笔记-陶*

        本文链接:https://www.haomeiwen.com/subject/mdyvbktx.html