統計資料常會受到不同因素(factor)的影響,而使個別觀測值產生差異。
為了使變異數分析更具有效率,預設實驗計劃方法,稱為實驗設計(design of experiment;DOE),
利用實驗過程中隨機混亂化與重複再現性,來讓主要影響因子顯著出現影響結果,使次要因子的影響減少,藉以增加檢定結果的可靠度。
1. 實驗單位(experiment unit):實驗設計中所測量的基本單位。
2. 因子(factor):實驗單位中各種不同的影響條件。
3. 水準(level):一因子出現的各種不同條件。
4. 處理(treatment):不同因子水準的每個特定組合稱為處理。
假設檢定是先對母體參數提出假設(主張),然後利用樣本的資訊,再決定是否接受或否決該假設。
H0 : 虛無假設,提出主張現狀。
H1 : 對立假設,並不符合現狀主張。
假設檢定有三種
雙尾檢定: H0 : θ=θ0; H1 : θ≠θ0
左尾檢定: H0 : θ≧θ0 ; H1 : θ<θ0
右尾檢定: H0 : θ≦θ0 ; H1 : θ>θ0
變異數分析的基本原理
單批平均數偏倚機率:數個母體平均數間的差異,如果差異夠大,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。
多批平均數變異偏倚機率:多批母體平均數間的差異的檢定,多批平均數間的變異數,大於統計上的隨機差異,便可能獲得顯著的檢定假設的結果。
單批平均數偏倚機率:
F(χ) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}, Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[( u )^2] / 2σ^2}。 u=χ-μ/σ,μ=0,σ=1,u=χ-0/1,u=χ。X→-∞∫X+∞ Ф(u) d(u)。
關注於ε 從x=0,u=0.5 ; x=-∞,u=0 ; x=+∞,u=1。 包含在μ值以上(以外)的機率,1-ε包含在μ值以下(以內)的機率,2ε 包含X±∞時μ值以上(以外)的機率,1-2ε 包含X±∞時μ值以下(以內)的機率。從1-2ε 包含X±∞時μ值以下(以內)的機率的當u=1.0,u=2.0,u=3.0,各是等於μ±1σ=68.3%,μ±2σ=95.4%,μ±3σ=99.7%。
Excel 中使用=NORM.S.DIST(Z ,1)(Z值表),這個函數關注的則是: § 常態密度函數的方程式 (cumulative = FALSE) 為:F(χ; μ, σ) = [ 1 / (σ (2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}=常態分布期間的機率質量函數(C=0)恰好等於x。 § 當 cumulative = TRUE 時,公式即為從無限大的負數到給定公式 x 的整數。 x=-∞ 到 x 的累積函數面積。
多批平均數變異偏倚機率,與單批平均數偏倚機率檢定不同處在於:
單批平均數X~N(μ, σ^2) ,多批則參考後擴展成X~N(μ,σ^2/n) )。
單批平均數樣本服從常態分布,在對變異數判斷時,即X~N(μ, σ^2),則以常態密度函數的方程式 F(χ; μ, σ)。
而多批則參考後擴展成X~N(μ,σ^2/n),F(χ; μ, σ/√n),在對變異數判斷時,多了/ n或是/ √n。
實務上,當我們無法確認群體分配數學函數曲線時,只要樣本數夠大,一般為30以上時,就算是多批樣本不同的機率分布為偏左、偏右分佈,仍在微觀處、部分處可視為與群體常態分布相同之常態分佈,雖群體常態分佈之Z = x ̄ -μ / σ/√n 未能確認,但可以以樣本標準差代替 σ,會令Z=x ̄ -μ / S / √n ,此時會符合常態分佈下自由度為n-1的t分配,記為Z=x ̄ -μ / S / √n ∽ t(n-1)。
沒有留言:
張貼留言