2022年12月17日 星期六

標準誤差變異數分析的基本原理標準差和標準誤的區別 -排列組合機率66

統計資料常會受到不同因素(factor)的影響,而使個別觀測值產生差異。
為了使變異數分析更具有效率,預設實驗計劃方法,稱為實驗設計(design of experimentDOE)
利用實驗過程中隨機混亂化與重複再現性,來讓主要影響因子顯著出現影響結果,使次要因子的影響減少,藉以增加檢定結果的可靠度。
1. 實驗單位(experiment unit):實驗設計中所測量的基本單位。
2. 因子(factor):實驗單位中各種不同的影響條件。
3. 水準(level):一因子出現的各種不同條件。
4. 處理(treatment):不同因子水準的每個特定組合稱為處理。

假設檢定是先對母體參數提出假設(主張),然後利用樣本的資訊,再決定是否接受或否決該假設。
H0 : 虛無假設,提出主張現狀。
H1 : 對立假設,並不符合現狀主張。

假設檢定有三種
雙尾檢定: H0 : θ=θ0 H1 : θ≠θ0
左尾檢定: H0 : θ≧θ0 H1 : θ<θ0
右尾檢定: H0 : θ≦θ0 H1 : θ>θ0

變異數分析的基本原理
單批平均數偏倚機率:數個母體平均數間的差異,如果差異夠大,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。
多批平均數變異偏倚機率:多批母體平均數間的差異的檢定,多批平均數間的變異數,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。


單批平均數偏倚機率:

F(χ) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(  u  )^2] / 2σ^2}  u=χ-μ/σμ=0σ=1u=χ-0/1u=χX→-∞∫X+∞ Ф(u) d(u)                                        
   
關注於ε x=0,u=0.5 ; x=-∞,u=0 ; x=+∞,u=1。 包含在μ值以上(以外)的機率,1-ε包含在μ值以下(以內)的機率,包含X±∞μ值以上(以外)的機率,1-2ε 包含X±∞μ值以下(以內)的機率。從1-2ε 包含X±∞μ值以下(以內)的機率的當u=1.0u=2.0u=3.0,各是等於μ±1σ=68.3%μ±2σ=95.4%μ±3σ=99.7%

Excel 中使用=NORM.S.DIST(Z 1)(Z值表),這個函數關注的則是: §  常態密度函數的方程式 (cumulative = FALSE) 為:F(χ; μ, σ) = [ 1 / (σ (2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}=常態分布期間的機率質量函數(C=0)恰好等於x §   cumulative = TRUE 時,公式即為從無限大的負數到給定公式 x 的整數。 x=-∞ x 的累積函數面積。                                

多批平均數變異偏倚機率,與單批平均數偏倚機率檢定不同處在於:

單批平均數XN(μ, σ^2) ,多批則參考後擴展成XN(μ,σ^2/n) )

單批平均數樣本服從常態分布,在對變異數判斷時,即XN(μ, σ^2),則以常態密度函數的方程式 F(χ; μ, σ)

而多批則參考後擴展成XN(μ,σ^2/n)F(χ; μ, σ/√n),在對變異數判斷時,多了/ n或是/ √n

實務上,當我們無法確認群體分配數學函數曲線時,只要樣本數夠大,一般為30以上時,就算是多批樣本不同的機率分布為偏左、偏右分佈,仍在微觀處、部分處可視為與群體常態分布相同之常態分佈,雖群體常態分佈之Z = x ̄ -μ  / σ/√n 未能確認,但可以以樣本標準差代替  σ,會令Z=x ̄ -μ  / S / √n ,此時會符合常態分佈下自由度為n-1t分配,記為Z=x ̄ -μ  / S / √n t(n-1)


沒有留言:

張貼留言