2022年12月27日 星期二

t分配與χ2卡方分配與Z分配的關係-排列組合機率76

 t分配與卡方分配與Z分配的關係

還記得標準常態分度的Z的定義=Z=x ̄ -μ  / σ/ √n 。還記得前面幾篇所講的漂準誤差的Z值嗎?
當符合足夠抽樣比時,這樣就可以使用標準常態分布方式來計算偏倚信賴區間:即Z{0.025}=1.96,EXECL=NORM.S.DIST(Z,1)=NORM.S.DIST(1.96,1)=0.975002,雙邊誤差為(1-0.975=0.025)X2=0.05 (即±5%)。
偏倚區間=x ̄(標準差)±(σx ̄(標準誤差X Z值)
此符合足夠抽樣比時取樣n項,其樣本平均值有95%偏倚信賴區間會落在:標準差±(標準誤差X1.96)的範圍內。

再往前追到二項分配:
二項分配的數學式:E(X)=np=μ ,Var(x)=np(1-p)= N Σ i=1 σN^2
常態分布的時候σ因為正負∞,所以Var(x)=σ^2決定了x軸分布的大小。
不過如果考慮的是單邊機率問題從-∞到x的值z= P(x-μ / σ),如果考慮的是雙邊機率問題-∞~X~+∞,σ(標準差)因為會變成σ^2(變異數),所以在計算z時z= P(x-μ / σ^(1/2))。

變異數分析的基本原理
單批平均數偏倚機率:數個母體平均數間的差異,如果差異夠大,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。
多批平均數變異偏倚機率:多批母體平均數間的差異的檢定,多批平均數間的變異數,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。

接著又深入一點,有個叫var(x)=用符號表示σ^2 /n(整個±∞曲線),然後再看單邊機率分布曲線又有σx ̄=σ/√n。
接著又深入一點,隨機變量Xij與總平均數的偏差的平方和,是所得全部多批數據的離散程度,偏差平方和中包含各總體之間,所抽取的某數據的差異,如果能把偏差平方和中的這兩部分信息分解出來並對其進行比較,就可以大概追尋到隨機因素造成的試驗誤差就,可以達到檢驗假設是否證真或證假的目的。

單批平均數偏倚機率:F(χ) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2},
Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(  u  )^2] / 2σ^2}。
u=χ-μ/σ,μ=0,σ=1,u=χ-0/1,u=χ。X→-∞∫X+∞ Ф(u) d(u)。

而多批則參考後擴展成X~N(μ,σ^2/n),F(χ; μ, σ/√n),
在對變異數判斷時,多了/ n或是/ √n,實務上,當我們無法確認群體分配數學函數曲線時,只要樣本數夠大,一般為30以上時,就算是多批樣本不同的機率分布為偏左、偏右分佈,仍在微觀處、部分處可視為與群體常態分布相同之常態分佈,
雖群體常態分佈之Z = x ̄ -μ  / σ/√n 未能確認,但可以以樣本標準差代替  σ,會令Z=x ̄ -μ  / S / √n ,
此時會符合常態分佈下自由度為n-1的t分配,記為Z=x ̄ -μ  / S / √n ∽ t(n-1)。

Z的定義=Z=x ̄ -μ  / σ/ √n 。
t的定義=t=x ̄ -μ  / S/ √n 。上下同除σ/ √n 
x ̄ -μ  / σ/ √n  =  S/ √n / σ/ √n。分子=x ̄ -μ  / σ/ √n =Z。分母=S /σ。
Z / S /σ。分母S /σ之上下在同乘於^2及同乘於(n-1)再開方,使與原式相等。
Z /  [ S^2 * (n-1) /σ^2 * (n-1)] ^1/2。其中的:(n-1)s^2/σ^2是服從n-1個自由度的卡方分佈。
最後得出t分配與卡方分配與Z分配的關係式為:t =  Z / [ χ2  /  (n-1) ]^1/2

沒有留言:

張貼留言