美文网首页
第2章 R编程入门(四):样本统计函数

第2章 R编程入门(四):样本统计函数

作者: 祝福你_7599 | 来源:发表于2020-10-18 11:21 被阅读0次

2.2 R常用函数及其应用

Function_name ( variable1, variable2, variable3 ···)

2.2.2 样本统计函数

函数 含义
min(x) 最小值
max(x) 最大值
mean(x) 平均数
median(x) 中位数
sum(x) 求和
sd(x) 标准差
var(x) 方差
mad(x) 绝对中位差(median absolute deviation)
quantile(x, probs) 分位数,x为待求分位数的数值型向量,probs为一个由[0, 1]之间的概率值组成的数值向量
diff(x, lag=n) 滞后差分,lag用以指定滞后几项,默认lag值为1
range(x) 值域
scal(x, center=TRUE, scale=TRUE) 为数据对象x按列进行中心化(center=TRUE)或标准化(center=TRUE, scale=TRUE
> min(c(1, 2, 3, 4, 5, 6, 7))      # 最小值
[1] 1
> max(c(1, 2, 3, 4, 5, 6, 7))      # 最大值
[1] 7
> mean(c(1, 2, 3, 4, 5, 6, 7))      # 平均值
[1] 4
> mean(c(1, 2, 3, 4, 5, 6))
[1] 3.5
> median(c(1, 2, 3, 4, 5, 6))        # 中位数
[1] 3.5
> sd(c(1, 2, 3, 4, 5, 6))          # 标准差
[1] 1.870829
> var(c(1, 2, 3, 4, 5, 6))           # 方差
[1] 3.5
> mad(c(1, 2, 3, 4, 5, 6))           #  绝对中位差
[1] 2.2239
> quantile(c(1,2,3,4,5,6),c(0.25,0.75))      # 25%分位数和75%分位数
 25%  75% 
2.25 4.75 
> range(c(1.1,2,4,6,8.5,9.7,10.2))        # 值域
[1]  1.1 10.2
> range(c(1.1,2,4,6,8.5,9.7,10.2,2.2))
[1]  1.1 10.2
  • 默认情况下,函数scale()对矩阵或数据框的指定列进行均值为0、标准差为1的标准化(归一化处理):
    mydata <- scale (mydata)
  • 要想对每一列进行任意均值和标准差的标准化,可:
    mydata <- scale (mydata) * SD + M

    M为想要的均值SD为想要的标准差

示例

> x <- c(1,2,3,4,5,6,7,8,9,15,12)
> mean(x)
[1] 6.545455
> sd(x)
[1] 4.274661
> n <- length(x)
> meanx <- sum(x)/n
> css <- sum((x-meanx)^2)
> sdx <- sqrt(css/(n-1))
> meanx
[1] 6.545455
> sdx
[1] 4.274661

资料

  • 中位数(median)
    有一组数据 X1, X2, ···, XN
    将它从小到大排序为 X(1), X(2), ···, X(N)
    N为奇数时:
    median = X_{(\frac{N+1}{2})}
    N为偶数时:
    median = \frac{X_{(\frac{N}{2})}+X_{(\frac{N+1}{2})}}{2}
  • 绝对中位差(Median Absolute Deviation)
    中位数绝对偏差
    原始数据减去中位数后,得到的新数据的绝对值的中位数
    mad=median(|X_i-median(X)|)
    R语言中的mad还要乘以一个比例因子1.4826,以使数据

相关文章

  • 第2章 R编程入门(四):样本统计函数

    2.2 R常用函数及其应用 Function_name ( variable1, variable2, varia...

  • 2020-10-26 学习小组Day4 笔记 --赵小草

    R语言入门 了解R语言 R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。R语言软...

  • 学习小组DAY4——R语言初上手

    R语言初上手 一、什么是R和RStudio R R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够...

  • 7月编程语言排行版来了,看看JavaScript排第几?

    7月份的编程语言根据TIOBE指数统计来了,看看JavaScript排第几? 统计编程语言R在本月从第9位升至第8...

  • 学习小组Day4笔记--镜筒

    R语言基础 R和RSTUDIO简介 1. R 一种编程语言 统计计算和绘图的环境 汇集了许多函数,能够提供强大的功...

  • 【生信星球:生信学习小组】第4天

    R R:一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。 Rstudio:免费提供的...

  • Day4 —刘强

    初识R语言 What's R? R是一种编程语言,提供了统计计算和绘图的环境。可调用许多函数,从而提供强大的数据处...

  • Part1:初识R预言

    1.R R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。 2.Rstudio R...

  • 学习小组Day4-Ju Chen

    R 语言及使用 1. R 简介: R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能...

  • 统计学6-抽样分布

    定义 抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统...

网友评论

      本文标题:第2章 R编程入门(四):样本统计函数

      本文链接:https://www.haomeiwen.com/subject/rayfmktx.html