“ 假装自己是学霸,像学霸一样早起、去图书馆、去看书,后来,你就成了学霸!”
文:蓝兔子读难NOTES
图: 配图 来源于网络
编码:0010
[Quantitative Methods]
[Hypothesis Testing]
金融领域可以说既是一个高门槛的领域也是一个低门槛的领域,说其高门槛,是因为各种海归博士常青藤也只有搬砖的命,说其低门槛是因为隔壁老王都能一边收着破烂一边玩着股票。
就以股票为例,基本上同小汽车一般进入了寻常百姓家,没玩过股票都不好意思和人一起吹牛。但是正如那句老话所说,股市有风险,投资需谨慎。在股票市场,既有默不吭声却挣得风生水起,也有一顿分析猛如狗,一旦开盘反向走的大V反向指标。有埋头专研的技术流,也有随风招摇的墙头草。
正所谓砖家一席话,多打十年工。各种各样的砖家大狮们经常瞎带节奏,鬼预测。今天说,某某股票明天会上涨,某某股票明天会下跌,你要是信了他的邪,最后你就知道什么叫做糟老头子坏得很了。
但是作为普普通通的我们,有没有办法来对这些砖家大V的言论准确性进行检验呢,这个时候假设检验就出场了。
引言
当我们对某一个具体的值的结果进行预测时,比如班上同学的平均身高,我们实际上是进行了一次假设,我们假设班上同学的身高是多少。那我们的假设是否成立呢?就可以通过假设检验去进行验证。
但是现在有一个问题,我们在进行预测时,我们可能假设平均身高为1.70米,但是经过统计发现,样本统计量的平均身高只有1.6999999米,那怎么来评判我们的预测是否正确呢?数据上来看,很明显是不相等的,但是从另外角度来看,我认为完全可以认为我们的猜测是对的。从统计学的角度来说,我们每次都是抽取的一个样本来分析的,也许我们永远也抽不到一个和总体均值相等的样本。那就意味着我们样本统计量也许永远不会和总体均值相等。
换句话说,不能因为统计结果和预测结果有差异就判定为预测不正确。因此伟大的前辈们提出了另一种思路:我不通过你对来证明你对,但我通过你不对来证明你不对。我不通过一件可能会发生的事情的发生来说明啥,但我会通过一件不可能发生的事情的发生来说点啥,通常,这个时候就是说点我们之前认知有误的事。
概念
假设检验(hypothesis testing)需要区别于参数估计(estimation),后者是对某一参数的值的估计,例如全班同学的身高是多少;而前者,则是要先对该参数进行假设,而后去判断假设得是否正确。在假设检验中,我们没法正面去判断假设是否正确,而是通过反向的思维去判定其不正确。
假设检验的步骤如下:
建立假设 Stating the hypotheses
确定合适的检验统计量及其概率分布Identifying the appropriate test statistic and its probability distribution
确定显著性水平Specifying the significance level
确定拒绝域形式Stating the decision rule
收集数据,计算检验统计量Collecting the data and calculating the test statistic
做出统计判断Making the statistical decision
做出投资决策Making the economic or investment decision
原假设(Null Hypothesis):就是要被检验的假设,一般标记为H0;
备择假设(Alternative Hypothesis):与原假设相对,标记为Ha或者H1,如果原假设被拒绝,则接受备择假设。
假设检验形式(Formulations of Hypotheses):
H0: θ = θ0 versus Ha: θ ≠ θ0 (a “not equal to” alternative hypothesis)
H0: θ ≤ θ0 versus Ha: θ > θ0 (a “greater than” alternative hypothesis)
H0: θ ≥ θ0 versus Ha: θ < θ0 (a “less than” alternative hypothesis)
一般等号放在原假设。
其中第一种为双尾检验(two- sided hypothesis test),第二和第三为单尾检验(one- sided hypothesis test),判断单尾还是双尾检验,就看拒绝域的分布。
检验统计量(test statistic)及其分布(distribution):还记得之前的样本统计量及其概率分布吗?假设检验也要抽取样本。不过不同之处在于,样本统计量是用来估计总体参数的,而检验统计量则是用来判断是否要拒绝原假设的。假设检验量可通过如下公式计算:
其中sample statistic就是样本统计量,如样本均值。标准误我们在区间估计那一部分内容说过。
第一类错误(Type I errors):错杀好人,原假设对了,却被拒绝,这种错误的概率为α;
第二类错误(Type II errors):放过坏人,原假设错了,却没有拒绝,这种错误的概率为β;
其中,正确接受H0(拒绝Ha)的概率为1-β,又叫做power of test。
显著性水平(significance level):如之前所说,假设检验是通过小概率事件不可能发生来进行检验的,那多小才算小呢,这就是由显著性水平来确定的。显著性水平其实类似于多小的概率算小概率,在已知样本统计量分布的情况下,可以通过分布查得此显著性水平对应的标准差范围,该值就是关键值(critical value)。
在该标准差以外的区域,即代表着小概率区域,也就是拒绝域(rejection region)。
如果进行一次数据收集,经过计算,结果落在了拒绝域,也就是落在了小概率区域,则说明小概率事件发生了,此时认为原假设存在毛病。
p值(p value),之前的关键值是通过显著性水平α查分布表得到的,它与拒绝域的x轴边界进行比较。而p value,是指拒绝原假设的最小显著性水平,即当P≤α时,拒绝原假设,是直接对概率进行比较。
统计显著(statistical result)与经济显著(economically meaningful result),这是因为在进行统计时,我们没有考虑后期的交易和税费等,所以统计数据上看,也许能够获得利益,但是实际上不一定能获取利益。
正态总体方差的检验
检验统计方法,这部分内容直接记住结论即可:
均值检验
单个正态总体,方差已知:z分布
单个正态总体,方差未知:t分布
两个正态总体,样本独立,方差未知但相等:t检验
两个正态总体,不独立:成对t检验
方差检验
单个正态总体:卡方检验(chi-square)
两个正态总体:F检验
此处的结论与我们之前的方差已知用z,方差未知用t相符。
相关性(correlation)分析的假设,这个教材后面习题出现了,记住公式:
t分布,r为相关系数,n-2为自由度。
最后还有一点,参数检验(parametric tests)与非参数检验(nonparametric test),参数检验的特征:
总是与总体参数有关,如均值、方差;
需假设总体服从某一特定分布。
非参数检验的情形:
无法进行参数检验,如分布未知或不服从分布;
斯皮尔曼等级相关(Spearman Rank Correlation)。
网友评论