美文网首页StatQuest学习笔记分享
31统计基础- 二项分布与检验

31统计基础- 二项分布与检验

作者: 不到7不改名 | 来源:发表于2021-01-06 10:09 被阅读0次

    我们将会使用二项分布(Binomial Distribution)模拟没有偏好时的预期结果。如果模型不合适,我们就会拒绝认为两种口味的人都受到同样的喜爱。

    让我们从一个超级简单的例子开始,假设我问了三个人他们是否更喜欢橙色芬达比葡萄芬达。假设他们有50%的机会选择橘子,50%的机会选择葡萄。然后我们可以计算两个人随机选择橘子,有1个人随机选择葡萄的概率。一共有三种情况,每种情况的的可能性:0.50.5*0.5=0.125,3个人中有2个人会说他们更喜欢橙色芬达的概率是0.375。

    image-20201228120201111.png

    或者,我们可以用公式来计算,x是喜欢橙色芬达的人数,x=2。n是我们问的总人数,n = 3。n-x是喜欢葡萄芬达的人数。p是某人选择橙色芬达的概率,p= 0.5。1-p是某人选择葡萄芬达的概率。

    image-20201228120340248.png

    公式中的第一部分是计算:三人中有两人说他们更喜欢橙色芬达的情况。

    image-20201228121058466.png

    公式的第二部分是计算:三人中有两人说他们更喜欢橙色芬达的概率。

    image-20201228121339914.png

    公式的第三部分是计算:三人中有一人说他们更喜欢葡萄芬达的概率。

    image-20201228121503537.png

    3个人中有2个人会说他们更喜欢橙色芬达的概率是:

    image-20201228121628648.png

    现在我们已经知道我们可以用二项分布(Binomial Distribution)计算概率了,让我们回到我们最初的问题"如果4个人说他们喜欢橙色芬达,3个人说他们喜欢葡萄芬达,我们能否得出这样的结论:人们普遍更喜欢橙色芬达?”

    首先我们用二项分布计算4个人说他们喜欢橙色芬达,3个人说他们喜欢葡萄芬达的概率:

    image-20201228121957555.png

    当你用二项分布来计算p值时,这叫做二项检验(Binomial Test)。p值是观测数据的概率(7个人中有4个人更喜欢橙色芬达),加上所有其他同样可能或更罕见的可能性。概率相等或更少的事件的所有组合的概率之和=0.5 +0.5=1。也就是说,7个人中有4个人更喜欢橙色芬达,他们的p值=1。这意味着模型,二项分布的p= 0.5,(即:橙味芬达和葡萄味芬达都很受欢迎),很适合观察到的数据。

    因此,我们得出结论:在样本大小为7的情况下,橘味芬达和葡萄味芬达同样受欢迎。

    image-20201228122420548.png

    相关文章

      网友评论

        本文标题:31统计基础- 二项分布与检验

        本文链接:https://www.haomeiwen.com/subject/fivmoktx.html