美文网首页
统计学-方差分析实践

统计学-方差分析实践

作者: Vicky_1ecd | 来源:发表于2020-02-23 18:07 被阅读0次

题目
数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:

1、每个地区间的销售量是否相同?

2、不同月份的销售量是否相同?

3、不同时间与地区的销售量是否相同?

       date     A     B     C     D
0 2019-12-01  8087  5923  9299  6287
1 2019-12-02  7851  5617  8984  6078
2 2019-12-03  4679  5481  8461  6735
3 2019-12-04  4296  6473  8407  1749
4 2019-01-04  7875  1688  5371  6377
5 2019-01-05  7271  6078  5923  6161
6 2019-01-06  9299  6735  5617  6861
7 2019-01-07  1749  2588  8407  1782
8 2019-03-08  3196  2595  9299  6820
9 2019-03-09  1220  1132  9627  6591

1、每个地区间的销售量是否相同?
用单因素方差分析,先假设,再构造统计量,最后进行决策
(1)假设H0,即假设样本A,B,C,D的均值相同,不同地区无显著性影响。H1:样本A,B,C,D均值不全相等,有显著性影响。
​(2)构造统计量,因素为地区,水平为4,因变量为销售量。

import numpy as np
import scipy.stats as stats
import pandas as pd
#读取数据
data=pd.read_excel("/Downloads/1销售数据.xlsx")

print(data.describe())  #统计数量、均值、标准差、上下四分位
print(data.mean().sum()/4)  #输出对应的总体均值
                A            B            C            D
count    11.000000    11.000000    11.000000    11.000000
mean   5150.454545  4329.909091  7457.909091  5588.727273
std    3049.346368  2079.064090  2234.142809  1912.142311
min    1132.000000  1132.000000  2642.000000  1749.000000
25%    2472.500000  2591.500000  5770.000000  6056.500000
50%    4679.000000  5481.000000  8407.000000  6287.000000
75%    7863.000000  6000.500000  9141.500000  6663.000000
max    9299.000000  6735.000000  9627.000000  6861.000000
5631.75

总平方和SST=95533231.1875+61867762.1875+86597368.1875+36583242.6875
组间平方和SSA=57894573.5196352
组内平方和SSE=222687030.727273
MSA=SSA/(4-1)=19298191.17 , MSE =SSE/(N-K)=31812432.96,
检验统计量F=MSA/MSE=0.606624184 , 在给定显著性水平a=0.05,在F分布表中查找分子自由度df1=4-1=3,分母自由度df2=n-k=11-4=7,相应的临界值Fa(3,7)=4.347,F<Fa 则不拒绝原假设H0,即认为各地区对销售量影响不显著。
问题2. 不同月份销售量不同?
1)假设H0:各月的均值相等,即各个月份对销售量无显著影响;H1:各个月份均值不完全相同,即不同月份对销售量有显著影响。

(2)构造和计算统计量
(所有数据按照月份分组,2019年3月数据少4行,因此保留前12行分析数据)
1)计算总体均值:5898.5,水平为3
2)总平方和SST=205887565
3)组间平方和SSA=39687746
4)组内平方和SSE=SST−SSA=205887565−39687746=166199819
5)MSA=SSA/(3-1)=19843873
MSE=SSE/(n-k)=SSE/(12-3)=18466646.56
6)F=MSA\MSE=1.074579131
(3)决策分析,F<Fa=Fa(2,9)=4.256,不拒绝原假设,即各个月份影响不显著。

问题3. 不同时间与地区的销售量是否相同?
这里按照无交互作用的双因素方差分析方法
(1)假设(2)构造统计量和计算(3)决策

(1)行因素:H0:假设日期对销售量无显著影响;H1:日期对销售量有显著影响;
列因素:H0:假设地区对销售量无显著影响H1:地区对销售量有显著影响列因素。
(2)构造统计量并计算:




(3)从上表中可以看出Fr<Fa,Fc<Fa,分别从地区、日期都对销售量影响不显著。

参考:《统计学(第七版)》贾俊平
https://blog.csdn.net/long636/article/details/104437179

相关文章

  • 统计学-方差分析实践

    题目数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决: 1...

  • 单因子方差分析

    参考书《白话统计学》 单因子方差分析(one-way analysis of variance, ANOVA),是...

  • 因子方差分析

    参考书 《白话统计学》 何时使用因子方差分析 因子方差分析适用于一个连续因变量以及两个或两个以上分类自变量的情形。...

  • 统计学-方差分析

    方差分析用于研究一个或多个分类型自变量与一个数值型因变量的关系。方差分析通过检验多个总体的均值是否相等来判断一个或...

  • Covariance

    协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法。在概率论和统计学中,协方差用于衡量两个变量的总体误...

  • 坚持 day19

    重新学习回顾大学统计学里的单因素方差分析,很多概念都忘了。 做了未来规划的思维导图。 明...

  • R语言|两因素重复测量方差分析

    转自个人微信公粽号【易学统计】的统计学习笔记:R语言:两因素重复测量方差分析[https://mp.weixin....

  • 250-今日总结

    英语 英语流利说 &潘多拉口语 专业课 心理统计学-方差分析概述(王老师课程视频) 开始测试anki使用情况,把之...

  • Python方差分析实践

    实践数据:链接: https://pan.baidu.com/s/1ljLoZrT_MnAZYnpOmJt0wQ ...

  • 非参数检验-原理

    ​其实按照正常的统计学教学大纲,t检验之后应该是学习方差分析的内容,但我之前也说过,既然咱们学习了t检验的使用,对...

网友评论

      本文标题:统计学-方差分析实践

      本文链接:https://www.haomeiwen.com/subject/mnxsqhtx.html