美文网首页
Python得到所有基准数据的标准差和均值

Python得到所有基准数据的标准差和均值

作者: 小杜的生信筆記 | 来源:发表于2021-12-07 22:20 被阅读0次

python

1. 得到所有基准数据的标准差和均值

目前,如果你还是编程小白!!

你咨询编程大神大神、大神,我想学编程,你说我是学Java、C语言、Python.......,还是其他的语言?你推荐先学哪一种编程语言呢?................

问题就如糖衣大炮一样,又让人应接不暇,无从下口。但是,大多数大神给你的回答就是学python,我前面也写过一篇博文为什么推荐学Python。首先,Python语法读起来还是比较简单的,类似于R语言一样,以及Python的用途很广等等因素结合起来,所以推荐小白的你来学Python。

但是说来惭愧,自己很早以前就一直有这个概念,有这样的想法,但是由于自己一直没有坚持下来,到现在还是不会写Python代码,惭愧,羞愧,害........,没有脸说什么吧。我自己也是个编程小白。

生信人,最少需要来掌握一门编程语言(PS:自己定义R语言不算,个人认为R是必须掌握的)。个人推荐,Perl或Python可以适当学一点哦!至少可以满足自己需求,如果你不会,那只能求助他人啦(满足这个条件的前提是,你身边有这样的大神)。


OK!! 前面都是些“废话”,我后续也会逐渐的分享一些关于Python的教程。

我们一起进步啦!! 一起学习!!


今天分享的教程是,求所有数据的标准差和均值

代码来自Nature Methods,题目OME-NGFF: a next-generation file format for expanding bioimaging data-access strategies,网址:https://www.nature.com/articles/s41592-021-01326-w#data-availabilit

1.1 原始数据


代码区
## python 
# Get the standard deviation and mean for all the benchmark data
# grouped by type (e.g. HDF5, TIFF, Zarr, Overhead) and by
# source (e.g. http, local, s3)

## 加载所需包
import pandas

# 加载我文件
for csv_file in ["2d_benchmark_data.csv", "3d_benchmark_data.csv"]:

    print(csv_file)

    df = pandas.read_csv(csv_file)

    print("Mean")
    mean_values = df.groupby(["type", "source"]).mean()
    # or if you only want the "seconds" column
    # mean_values = mean_values["seconds"]
    print(mean_values)

    print("Std")
    std_values = df.groupby(["type", "source"]).std()
    print(std_values)

代码分段式

for csv_file in ["2d_benchmark_data.csv", "3d_benchmark_data.csv"]:

    print(csv_file)

求均值

df = pandas.read_csv(csv_file)

    print("Mean")
    mean_values = df.groupby(["type", "source"]).mean()

输出结果如下:

2d_benchmark_data.csv
Mean
type      source
HDF5      http      0.221113
          local     0.002818
          s3        1.121805
Overhead  http      0.001269
          local     0.000014
          s3        0.011279
TIFF      http      0.151114
          local     0.086267
          s3        0.388272
Zarr      http      0.006652
          local     0.007099
          s3        0.131575
Name: seconds, dtype: float64
Std
                 duration  chunk_distance      round   seconds
type     source                                               
HDF5     http    0.051123   149981.733567  29.011492  0.051115
         local   0.004189   149981.733567  29.011492  0.004156
         s3      0.322672   149981.733567  29.011492  0.322666
Overhead http    0.001197   149981.733567  29.011492  0.001187
         local   0.000016   149981.733567  29.011492  0.000002
         s3      0.002839   149981.733567  29.011492  0.002838
TIFF     http    0.037332   149981.733567  29.011492  0.037327
         local   0.036226   149981.733567  29.011492  0.036227
         s3      0.088530   149981.733567  29.011492  0.088532
Zarr     http    0.001773   149981.733567  29.011492  0.001760
         local   0.002866   149981.733567  29.011492  0.002868
         s3      0.019592   149981.733567  29.011492  0.019609
3d_benchmark_data.csv
Mean
type      source
HDF5      http      0.220592
          local     0.002479
          s3        1.046130
Overhead  http      0.001163
          local     0.000023
          s3        0.012607
TIFF      s3        0.928801
Zarr      http      0.013290
          local     0.007667
          s3        0.100552
Name: seconds, dtype: float64
Std
                 duration  chunk_distance      round   seconds
type     source                                               
HDF5     http    0.051433    906299.64163  29.011492  0.051430
         local   0.002911    906299.64163  29.011492  0.002880
         s3      0.259094    906299.64163  29.011492  0.259042
Overhead http    0.000518    906299.64163  29.011492  0.000509
         local   0.000086    906299.64163  29.011492  0.000051
         s3      0.005196    906299.64163  29.011492  0.005179
TIFF     s3           NaN             NaN        NaN       NaN
Zarr     http    0.009346    906299.64163  29.011492  0.009336
         local   0.006391    906299.64163  29.011492  0.006381
         s3      0.015169    906299.64163  29.011492  0.015172

Process finished with exit code 0


初学者,很多不懂,请大家多多指教!!

一起进步哦!!!


“小杜的生信筆記” 公众号、知乎、简书,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!

相关文章

  • Python得到所有基准数据的标准差和均值

    python 1. 得到所有基准数据的标准差和均值 目前,如果你还是编程小白!! 你咨询编程大神:大神、大神,我想...

  • 协方差和协方差矩阵

    均值与方差 均值:方差:均值、方差和标准差可用于描述数据的集中趋势和离散程度。 协方差 方差一般用来描述一维数据,...

  • 2. 平均值,标准差,期望: 标准差

    1. 方差和标准差:数据的离散情况 方差是各个数据对均值的偏离程度,但是根据(均值的性质1.1),各项减均值差的和...

  • 统计学的公式总结

    整理一下平均值,标准差,样本标准差 收集了5份考试数据50, 70, 60 ,65, 80分。那么它的:均值μ是 ...

  • 3、StatQuest学习——标准差,标准与置信区间

    8、标准差与标准误 标准差 标准误 五次实验得到了5个均值和标准差 标准误:给定样本大小(里面有多少个观测值),样...

  • 均值、标准差、偏度、峰度的绘制

    练习:均值、标准差、偏度、峰度的绘制 均值 标准差 偏度 峰度

  • 15、标准差

    标准差为方差的平方根,是表述数据和均值之间的偏离程度的一个重要标志。 总体标准差的符号是σ 中文读西格玛样本标准差...

  • 《商务与经济统计》第12版学习10

    第10章 两总体均值和比例的推断 10.1 两总体均值之差的推断:总体标准差1和总体标准差2已知 10.1.1 u...

  • 第三次作业——正态分布

    对数据的理解: 该组数据平均值是100.83,标准差是15.02。 大部分的数据集中在85至115之间。 离平均值...

  • 标准差与标准误

    标准差 在统计中,标准差是一种用于量化一组数据值的变化或分散程度的度量。一个较大的标准差,代表大部分数值和其平均值...

网友评论

      本文标题:Python得到所有基准数据的标准差和均值

      本文链接:https://www.haomeiwen.com/subject/khaaxrtx.html