課程連結:
台灣交通大學 統計學(一) Statistics I 唐麗英老師
[統計學筆記及整理]
第六章(續) 抽樣分佈(Sampling Distributions )
抽樣分佈(Sampling Distributions)
-
回顧:參數與統計量(Parameter and statistic)
根據群體中的觀察計算的數量稱為參數。
根據樣本中的觀察計算的數量稱為統計量。
-
Def : Sampling Distribution 抽樣分佈
當從給定群體重複抽取(會放回即可重複)大小為n的隨機樣本時得到的統計量的概率分佈稱為統計量的抽樣分佈。 -
例:
樣本均值的分佈是一種抽樣分佈。
樣本比例的分佈是另一種抽樣分佈。
利用蒙地卡羅模擬法模擬抽樣分佈(Approximating a Sampling Distribution by Monte Carlo Simulation)
-
例1:
對於從圖6.12所示的均勻概率分佈中抽取的n = 5個觀測樣本。 注意,均勻分佈的平均值μ= 0.5。 對n = 15,25,50和100重複該過程。
模擬樣本均值的抽樣分佈
-
模擬程序
使用Minitab從均勻概率分佈中獲得10,000個大小為n = 5的隨機樣本,在區間(0,1)上,並為每個樣本計算𝐘。 然後,繪製10,000的values值的直方圖。 對n = 15,25,50和100重複該過程。
-
統一均值(0,1)的模擬抽樣分佈
-
基於均勻分佈的獨立隨機樣本的的模擬採樣分佈的直方圖接近正態分佈。 請注意:
1)的值傾向於聚集(群聚)關於均勻分佈的均值。
2)隨著樣本量n的增加,的採樣分佈變化較小,的抽樣分佈形狀傾向於正態分佈的形狀。
-
例2:
基於指數分佈的獨立隨機樣本的的模擬採樣分佈的直方圖接近正態分佈。其餘結論與上例相同。
-
指數均值的模擬抽樣分佈(β= 1)
-
例3:
基於正態分佈的獨立隨機樣本,的模擬抽樣分佈的直方圖接近正態分佈。其餘結論與上例相同。
-
正態均值(0,1)的模擬抽樣分佈
抽樣分布的特性與樣本平均數(The Sampling Distributions of Means and Sums)
1)樣本均值的抽樣分佈是什麼,(當σ已知時)?統計在重複採樣中的表現如何?
-
例1:
1)假設一個群體由四個數字組成(N = 4):1,2,3,4
2)由於四個值是不同的,群體概率分佈為群體中的每個x值賦予1/4的相等概率。
-
步驟1:現在,從群體中取一個大小為2的隨機樣本。 有多少可能的樣品?
-
步驟2:現在構建樣本均值的概率分佈
對於的概率分佈,樣本均值的均值和样本均值的方差為:
= 2.5
-
結論:
1)
2),其中n是樣本大小。
3)原始種群的分佈無論是否為常態,大部分樣本均值的分佈接近正態分佈。 -
The Central Limit Theorem (C.L.T.) 中央極限定理
隨著n變大,近似將變得越來越準確。
如果從具有平均μ和標準偏差σ的總體中抽取n個觀測值的隨機樣本,則當n大(n≥30)時,的採樣分佈近似正態分佈為,並且。
備註:如果群體是常態的,那麼無論樣本大小(n)如何,樣本均值的分佈總是常態的。 -
例1:假設X遵循均值且方差的分佈。 從該群體中抽取大小為25的樣本。 的分佈是什麼?
- 例2:某品牌維生素的平均維生素B-2含量為30毫克,標準偏差為2毫克。 質量控制檢查員選擇36個藥丸進行測試。 這36粒藥丸的平均維生素B-2含量低於28毫克的概率是多少?
根據中央極限定理,n=36,非常近似常態分怖。
低於28的概率為:
- 例3:如果1加侖的某種油漆覆蓋平均513.3平方英尺,標準偏差為31.5平方英尺,那麼這些1加侖罐中的40個樣品所覆蓋的平均面積"從510.0到520.0平方英尺"的概率是多少?
-
樣本比例的抽樣分佈是什麼,
1)p:群體比例
2):樣本比例 = x / n =成功次數/總試驗次數 -
定理:的採樣分佈
當樣本量n很大時,的採樣分佈近似正態,平均值為p,標準差為。
-
例4:製造公司的生產線生產10%的缺陷產品。 如果採樣n = 64項,那麼樣本缺陷率低於8%的概率是多少?
p=0.1=,n=64,q=0.9,
- 定理:正態隨機變量和的採樣分佈
- 例: 假設您選擇來自兩個常態群體的獨立隨機樣本,的觀察來自群體和的觀察來自群體。如果群體和的均值和方差分別是和,並且如果和是相應的樣本均值,找出差值的分佈()。
解:
2)樣本均值的採樣分佈是什麼,(當未知時)?
-
定理:如果是取自具有平均和方差的正態分佈群體,大小為的隨機樣本的平均值,則樣本統計量
具有自由度為的T分佈,。
s=樣本標準差取的n越大的越接近
注意:T分佈也稱為“學生T分佈” -
什麼是“學生”T分佈?
T統計量的概率分佈首次發表於1908年,由W.S.撰寫。戈塞特。 當時,Gosset受僱於愛釀酒廠,該釀酒廠不允許其員工發表研究報告。 為了規避這一限制,他以“學生”的名義秘密出版了他的作品。 因此,T的分佈通常稱為學生的T分佈,或簡稱為T分佈。 -
T分佈的屬性:T分佈非常像Z分佈
-
T分佈和Z分佈的比較
1)兩者都是對稱的,鐘形的。
2)兩者的平均值為0。
3)在重複採樣中T比Z更可變。(T分佈的尾部有更多的區域,中間的Z分佈更高)。
4)作為d.f.的數量 當沒有限制地增加(即,當n增加)時,T分佈接近Z分佈。
-
什麼是自由度(Degree of Freedom,d.f.)?
我們使用自由度作為樣本信息的度量。
例如,我們說T統計量具有自由度,群體的參數的自由度為 -
為什麼?
在正態分佈的大小為的隨機樣本中存在個自由度或獨立信息。
在計算時,我們不知道並且需要使用樣本數據來估計。當數據(樣本中的值)用於計算用於獲得的平均值時,用於估計的信息中的自由度減少。 -
T分配表
-
例1:當且時,找到和。
-
例2:當且時,找到和。
-
例3:當且時,找到和。
正態分佈相關的抽樣分佈(The Sampling Distributions Related to the Normal Distribution)
-
- 分佈(卡方分佈)
如果是取自具有方差的正態分佈群體的大小為的隨機樣本的方差,則
有一個(希臘字母,Chi)分佈與
-
表給出了在和的各種值的分佈的上尾部中的區域的值。
-
例1:如果,請使用表確定=?
-
例2: 考慮一個生產8盎司加工玉米罐頭的罐頭廠。
當每罐填充量的真實變化小於0.0025時,質量控制工程師已確定過程正常運行。
從一天的生產中選擇罐的隨機樣品,並記錄每個罐的填充量(以盎司為單位)。
關心的是樣本方差,。 實際上,如果,則發現超過的概率。假設填充量是正態分佈的。
我們想要計算。 假設從正態分佈中選擇10個填充量的樣本。
具有自由度的卡方概率分佈。因此,我們尋求的概率可以寫成
因此,當真實總體方差等於時,樣本填充量的方差超過的概率很小(在0.005和0.01之間)。
-
分佈
定義:設為標準正態隨機變量,為具有自由度的卡方隨機變量
具有分子(分子自由度)和 分母(分母自由度)的分佈。
-
定理:如果X是取自具有平均和方差的正態分佈群體的大小為的隨機樣本的平均值,則樣本統計量
具有自由度(自由度)的分佈
-
例3:假設隨機變量和是來自具有平均和方差的正態分佈群體的n個觀測值的隨機樣本的均值和方差。 可以證明,當採樣總體具有正態分佈時,和在統計上是獨立的。 使用此結果顯示
具有自由度的分佈。
-
分佈
定義:設和分別為兩個獨立的卡方隨機變量,其中和自由度分別為
具有分子的分佈。 (分子自由度)和分母(分母自由度)
-
定理:如果和是大小為的隨機樣本和取自兩個具有相同方差的正態總體的的方差,那麼
具有的F分佈。 -
F分佈表
表給出了的值,其對於和的各種值,在分佈的上尾部中定位的區域。 -
例:如果,使用表確定 =?
网友评论