美文网首页
R 笔记(基础内容)

R 笔记(基础内容)

作者: 存存baby | 来源:发表于2019-08-01 18:37 被阅读0次

    barplot(a)  #直方图 数值型变量--每一个独立      VS    hist(a)  #画直方图

    barplot(table(a))  #频数分布直方图 

    stem(a)  #茎叶图

    boxplot (a) #箱线图

    plot()    #散点图

    mean(mpg)   # 计算平均值

    mean(mpg,trim=.1)     # 计算截去10%的平均值

    tapply(mpg,cyl,mean)   #按分组变量cyl计算mpg的分组平均数  

    tapply(mpg,cyl,mean)   #按分组变量cyl计算mpg的分组平均数  

    IQR(mpg)    # 计算四分位数的极差

    quantile(mpg)   =  fivenum(mpg)      # 计算样本常用的分位数:极小、极大、中位数及两个四分位数quantile(mpg, probs=c(0.1,0.25,0.75))     #计算由向量prob给定的各概率处的样本分位数(10%.25%.75%)

    summary(mpg)   #最小值、第一四分位数、中位数、平均数、第三分位数和最大值

    sd()   #标准差     var()   #方差   mad()  #中位绝对离差

    z=lm(cyl~mpg)     # 拟合线性回归(注意:用~分割,不是逗号)

    cor(cyl,mpg)    # 相关系数

    # 残差分析

    lm.res=lm(cyl~mpg)   # 将回归分析的结果作为对象,保存到 lm.res 

    lm.resids=resid(lm.res)  # 提取残差向量

    plot(lm.resids)# 考察残差的散点图

    hist(lm.resids)# 考察残差的直方图

    qqnorm(lm.resids)# 残差的QQ图是否落在直线上

    ls()函数显示所有在内存中的对象,ls.str()显示所有对象的详细信息

     rm()     # 删除对象使用 

    rm(x)  删除对象x

    rm(x, y)删除对象x,y

    rm(list=ls())删除内存中所有对象

    rm(list=ls(pat="^m"))     删除对象以字母m开头的对象

    rep(x, time = , length = , each = ,)     rep表示重复的意思???

     examples:

         > rep(1:4, 2)

        [1] 1 2 3 4 1 2 3 4

        > rep(1:4, each = 2)

        [1] 1 1 2 2 3 3 4 4

        > rep(1:4, each = 2, len = 10)

        [1] 1 1 2 2 3 3 4 4 1 1

    rep(c(3,5),c(2,4))  #表示出2遍3,,4遍5  

    单独出数字,只能用:表连续,不连续则赋予c 建立字符向量,必须加“”号,c赋值,后边无逗号

    所有转化为因子都用factor()      再转化为数值因子levels(a)=c(1,2,3,4)

    所有转化为因子都用factor()

    函数gl()能产生规则的因子序列,用法为gl(k,n),其中k是水平数,n是每个水平重复次数。length选项指定产生数据的个数,label指定水平因子的名字。

    length表示截至长度,label别拼写错了,有多少类就有多少labels,并不是类别。所以是前面的数字。 []中括号表示取值。负号表示不取某个值 # 带name属性的字符串向量可以通过name提取 根据逻辑向量取值


    数组 array 

    格式:   array(data,dim,dimnames)

    data为向量,其元素用于构建数组;dim为数组的维数向量(数值型);dimnames为各维度名称构成的向量,缺省为空。

    数组用array

    矩阵 matrix

    x=matrix(1:12,nr=3,nc=4)    #表示从1-12之间取值,填充3行,4列。

    diag()    #生成单位阵

    x=diag(4) x=diag(5) d单位阵数值可以用向量c替换 重命名x,  写全称:rownames,colnames。 修改通过行填充数据,byrow=TRUE.      跟t(x)转置差不多

    合并表格

    x*x表示x表格的数值都平方 按照上边的表格对行和列求平均 

    # 变量之间的关系可以通过成对数据散点图考查  pairs(Puromycin,panel=panel.smooth) xtabs (~mpg+disp,data=文件)     #xtabs是根据分类因子形成一个列连表

    数据框添加新变量

    字符向量的建立

    z = c("green", "bluesky", "-99")

    labs=paste("x",1:10,seq=",")      #x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

    labs=paste("x,y",1:3)        #xy1 xy2 xy3

    labs=paste("x,y",1:3,seq=",")         #x,y1   x,y2    x,y3

    补充:

    a=c("M","F","M","F","M","M")          #table表示分类计数(频数)

    table(a)

    a

    F M

    2 4

    数据框的建立

    a=c(41,22,23,43,52)

    b=1:5

    b=data.frame("性别"=b,"年龄"=a) 

    #建立了两纵行(性别,年龄),性别=1,2,3,4,5,年龄=41,22,23,43,52

    正态分布函数rnorm()

    泊送分布函数rpois()

    指数分布函数rexp()

    Gamma分数函数rgamma()

    均匀分布函数runif()

    二项分布函数rbinom()

    几何分布函数rgeom()

    rbind(x1, x2)  注:r是row的意思,即行,按行组成矩阵。

    cbind(x1, x2)  注c是column的意思,即列,按列组成矩阵。

    apply(x, 2, mean)  --对x在列的方向求平均值,如果2改成1则对行求平均值

    安装包代码 

    #if (!requireNamespace("BiocManager", quietly = TRUE))

    #install.packages("BiocManager")

    #BiocManager::install("pheatmap")

    相关文章

      网友评论

          本文标题:R 笔记(基础内容)

          本文链接:https://www.haomeiwen.com/subject/rvnorctx.html