Pandas与SQL对比 作为一名数据分析师,平常用的最多的工具是SQL(包括MySQL和Hive SQL等)。对...[作者空间]
举例[作者空间]
二项分布和泊松分布都描述的是事件成功次数的分布,泊松分布是二项分布的极限分布,其适用条件是n很大,p很小的情况。生...[作者空间]
dplyr包是R语言数据处理的神器,这里记录一点刚学到的东西。 以下操作基于R语言自带数据集"mtcars". 变...[作者空间]
当我们从测序数据中得到了一系列的基因后,我们需要研究这些基因都属于那些通路,那些通路是跟我们研究课题相关的。为了解...[作者空间]
今天在计算基因表达相关时R抛出error,生成NA值 于是我检查两个变量是否有NA值,结果没有,我就奇怪了。goo...[作者空间]
2.1 数据的重要特征 1、中心性 Center:反映数据集中心点位置的代表值或平均值2、异众性 Variatio...[作者空间]
问题 你想要检验来自两个总体的样本是否有不同的均值(显著性差异),或者检验从一个总体抽取的样本均值和理论均值有显著...[作者空间]
前言 在microbiome analysis中,有着大量的A,诸如PCA,PCoA,RDA,CCA,ICA之类的...[作者空间]
这一部分的内容是后续所有算法的基础的基础。就是我们常说的各种检验,例如:t检验,Z检验,F检验,卡方检验等等。这些...[作者空间]
统计术语中,相关系数一词经常被滥用,同时也困扰着我。相关系数描述一个变量随着另一个变量的增加而增加,也可以理解为单...[作者空间]
感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,...[作者空间]
pandas可利用loc,iloc以及ix来提取特定行列,在最新版的pandas中ix已被弃用,推荐使用loc,和...[作者空间]
本部分笔记是整理近期我在科研工作中接触到的一些统计检验方法,为了避免篇幅太长,内容分为几篇,每篇讨论一种检验方法。...[作者空间]
生物考完归来,只剩生物统计学待我手刃了。转眼着手于熟悉的环境,想想学习R也有几个月的时光了。谈得上入手,谈不上熟练...[作者空间]
(一)pandas基础 常用的两种数据结构:Series,DataFrame. 鉴于Series可根据index取...[作者空间]
np.array() 最常见的创建数组的方法。 一些小tricks,np.zeros(),np.ones(),np...[作者空间]
本文用Python统计模拟的方法,介绍四种常用的统计分布,包括离散分布:二项分布和泊松分布,以及连续分布:指数分布...[作者空间]
1 import语句 2 文件读取 3 数据预处理 4 数据筛选 5 数据运算与排序 6 数学统计[作者空间]
编者按:t 检验无疑是医学论文中使用频率最高的一种统计方法,可以毫不夸张地说,95%以上的医学科学论文都会应用 t...[作者空间]