銘記星辰之下: 標準誤差變異數分析的基本原理標準差和標準誤的區別 -排列組合機率66

統計資料常會受到不同因素(factor)的影響，而使個別觀測值產生差異。
為了使變異數分析更具有效率，預設實驗計劃方法，稱為實驗設計(design of experiment；DOE)，
利用實驗過程中隨機混亂化與重複再現性，來讓主要影響因子顯著出現影響結果，使次要因子的影響減少，藉以增加檢定結果的可靠度。
1. 實驗單位(experiment unit)：實驗設計中所測量的基本單位。
2. 因子(factor)：實驗單位中各種不同的影響條件。
3. 水準(level)：一因子出現的各種不同條件。
4. 處理(treatment)：不同因子水準的每個特定組合稱為處理。

假設檢定是先對母體參數提出假設（主張），然後利用樣本的資訊，再決定是否接受或否決該假設。
H0 : 虛無假設，提出主張現狀。
H1 : 對立假設，並不符合現狀主張。

假設檢定有三種
雙尾檢定： H0 : θ=θ0； H1 : θ≠θ0
左尾檢定： H0 : θ≧θ0 ； H1 : θ<θ0
右尾檢定： H0 : θ≦θ0 ； H1 : θ>θ0
變異數分析的基本原理
單批平均數偏倚機率：數個母體平均數間的差異，如果差異夠大，大於統計上的隨機差異，便可能獲得顯著的檢定假設的結果。
多批平均數變異偏倚機率：多批母體平均數間的差異的檢定，多批平均數間的變異數，大於統計上的隨機差異，便可能獲得顯著的檢定假設的結果。

單批平均數偏倚機率：

F(χ) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}， Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[( u )^2] / 2σ^2}。 u=χ-μ/σ，μ=0，σ=1，u=χ-0/1，u=χ。X→-∞∫X+∞ Ф(u) d(u)。
關注於ε 從x=0,u=0.5 ; x=-∞,u=0 ; x=+∞,u=1。包含在μ值以上(以外)的機率，1-ε包含在μ值以下(以內)的機率，2ε 包含X±∞時μ值以上(以外)的機率，1-2ε 包含X±∞時μ值以下(以內)的機率。從1-2ε 包含X±∞時μ值以下(以內)的機率的當u=1.0，u=2.0，u=3.0，各是等於μ±1σ=68.3%，μ±2σ=95.4%，μ±3σ=99.7%。

Excel 中使用=NORM.S.DIST(Z ，1)(Z值表)，這個函數關注的則是： § 常態密度函數的方程式 (cumulative = FALSE) 為：F(χ; μ, σ) = [ 1 / (σ (2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}=常態分布期間的機率質量函數(C=0)恰好等於x。 § 當 cumulative = TRUE 時，公式即為從無限大的負數到給定公式 x 的整數。 x=-∞ 到 x 的累積函數面積。

多批平均數變異偏倚機率，與單批平均數偏倚機率檢定不同處在於：

單批平均數X～N(μ, σ^2) ，多批則參考後擴展成X～N(μ,σ^2/n) )。

單批平均數樣本服從常態分布，在對變異數判斷時，即X～N(μ, σ^2)，則以常態密度函數的方程式 F(χ; μ, σ)。

而多批則參考後擴展成X～N(μ,σ^2/n)，F(χ; μ, σ/√n)，在對變異數判斷時，多了/ n或是/ √n。

實務上，當我們無法確認群體分配數學函數曲線時，只要樣本數夠大，一般為30以上時，就算是多批樣本不同的機率分布為偏左、偏右分佈，仍在微觀處、部分處可視為與群體常態分布相同之常態分佈，雖群體常態分佈之Z = x￣－μ / σ/√n 未能確認，但可以以樣本標準差代替 σ，會令Z=x￣－μ / S / √n ，此時會符合常態分佈下自由度為n-1的t分配，記為Z=x￣－μ / S / √n ∽ t(n-1)。

銘記星辰之下

標準誤差變異數分析的基本原理標準差和標準誤的區別 -排列組合機率66

沒有留言:

張貼留言

人生總有崩潰低谷，但不願認錯就只能原地打轉。