美文网首页
🧐 pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量

🧐 pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量

作者: 生信漫卷 | 来源:发表于2022-12-29 17:35 被阅读0次

写在前面

估算前瞻性研究样本量是我们在招募受试者之前首先要做的事情之一。😘
招募受试者太少会无法得到准确的答案,招募的太多又是巨大的浪费,所以需要估算最佳的受试者数量。🧐
本期我们介绍一下如何使用pwr包进行样本量的估算。😏

用到的包

rm(list = ls())
library(pwr)
library(tidyverse)

研究假设

假设我们准备进行一个RCT研究,研究Treatment ATreatment B的疗效,结局事件为ResponseNo response二分类结局。🤫
那我们现在就有了研究假设,H_0H_1了:👇

  • H_0: Treatment ATreatment B间结局事件无差异。
  • H_1: Treatment ATreatment B间结局事件有差异。

通常我们还有几个参数需要设置:👇

  • alpha level (通常为two-sided);
  • effect size (h);
  • power (通常为80%)

计算样本量

这里我们需要用到pwr.2p.test函数,我们通常需要设置Treatment ATreatment Bresponse比例,这个大家可以通过既往的文献来查找。😘
如果你做的研究非常新,在过去的文献中找不到的话,可以假设为50%。😂
这里我们假设Treatment A反应率是60%Treatment B反应率是50%,这样Treatment ATreatment B间的response比例就相差了10%,哈哈哈哈。😉

power1 <-pwr.2p.test(h = ES.h(p1 = 0.60, p2 = 0.50), sig.level = 0.05, power = .80)
power1

Note! 需要注意的是这里n只是一个组的数量,实际需要的总数量是需要double的。🤞

Power Analysis

接着是效力分析Power Analysis),主要是用来确定在指定显著性条件下所需要的样本量并评估该实验设计的统计效力。😗
通过Power Analysis,我们也能给出在现有的样本量下该实验结论的可靠性。🤩
如果结论的可靠性非常低,那么几乎可以认为实验是无效的,我们应该修改或者直接终止实验。🫠

plot(power1)

这里我们可以看到power随样本量增加的变化。🤓

改变一下

这个时候我们改一下Treatment A反应率,并且将每组的样本量固定为388α值0.05

p1 <- seq(0.5, 1.0, 0.05)

power1 <-pwr.2p.test(h = ES.h(p1 = p1, p2 = 0.50),
                     n = 388,
                     sig.level = 0.05)

power1

可视化一下可以看到Treatment A反应比例越高,和Treatment B差异越大,power就越大。😏

powerchange <- data.frame(p1, power = power1$power * 100)

plot(powerchange$p1, 
     powerchange$power, 
     type = "b", 
     xlab = "Proportion of Responders in Treatment A", 
     ylab = "Power (%)")

<img src="https://img.haomeiwen.com/i24475539/40562ed83cfc1237.png" alt="鲱鱼罐头" style="zoom:25%;" />

<center>最后祝大家早日不卷!~</center>


点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

<center> <b>📍 往期精彩 <b> </center>

📍 <font size=1>🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!</font>
📍 <font size=1>🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?</font>
📍 <font size=1>🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)</font>
📍 <font size=1>🤩 scRNA-seq | 吐血整理的单细胞入门教程</font>
📍 <font size=1>🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~</font>
📍 <font size=1>🤩 RColorBrewer | 再多的配色也能轻松搞定!~</font>
📍 <font size=1>🧐 rms | 批量完成你的线性回归</font>
📍 <font size=1>🤩 CMplot | 完美复刻Nature上的曼哈顿图</font>
📍 <font size=1>🤠 Network | 高颜值动态网络可视化工具</font>
📍 <font size=1>🤗 boxjitter | 完美复刻Nature上的高颜值统计图</font>
📍 <font size=1>🤫 linkET | 完美解决ggcor安装失败方案(附教程)</font>
📍 <font size=1>......</font>

本文由mdnice多平台发布

相关文章

  • 朴素贝叶斯分类——大道至简

    分类问题 已知m个样本 ,x是特征变量,y是对应的类别。 要求一个模型函数h,对于新的样本 ,能够尽量准确的预测出...

  • 朴素贝叶斯分类——大道至简

    分类问题 已知m个样本 ,x是特征变量,y是对应的类别。要求一个模型函数h,对于新的样本 ,能够尽量准确的预测出 ...

  • 决策树建模

    1.通过对训练样本的学习,并建立分类规则,然后依据分类规则,对新样本数据进行分类预测。2.虚拟变量:sklearn...

  • 机器学习——逻辑回归代价函数

    逻辑回归的代价函数 如上图,对于二分类逻辑回归,即有m个样本,每个样本的特征X有n+1个(Xo=1),分类变量Y属...

  • 松弛因子和惩罚因子

    对于一个分类问题,其样本集中往往存在一些模糊不清的样本,直观上,考虑SVM分类器,这些样本往往处于超平面的附近。这...

  • 用KNN算法判断知识掌握程度高低

    KNN算法既可以解决分类问题,也可以解决预测问题。 对于离散型因变量,从k个最近的已知类别样本中挑选出频率最高的类...

  • 流量显示仪表(JB/T 2274—91)

    流量计的分类 按测量介质分类 1.气体流量计; 2.液体流量计; 3.蒸汽流量计; 4.固体流量计; 5.通用流量...

  • 系统抽样和随机抽样样本量的计算

    随机抽样样本量计算 当抽样比f=n/N≤0.05时,总体为无限总体,样本单元数常采用简单随机抽样,样本数量计算公式...

  • 机器学习:分类 vs 回归

    分类是给一个样本预测离散型类别标签的问题。回归是给一个样本预测连续输出量的问题。 从根本上来说,分类是预测一个标签...

  • 用SMOTE算法和XGBoost模型处理信用卡欺诈数据

    如果分类问题中类别型的因变量可能严重失衡,例如欺诈问题中,欺诈类观测在样本集中占少数;客户流失问题中,忠实的客户也...

网友评论

      本文标题:🧐 pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量

      本文链接:https://www.haomeiwen.com/subject/clbtcdtx.html