(以下書中筆記心得摘錄內容及例題來自為:發行時間於民國75年一月,由中興管理顧問公司發行,書名:品質管制與工廠統計一書,譯者:陳文哲(現任國立交通大學管理科學研究所專任教授),黃清連(中國鋼鐵股份有限公司技術開發處長)。原著者為中井重行(早稻田大學工業經營科主任),池澤辰夫(早稻田大學工學教授)。
從使用-排列組合機率68開始至今,能夠符合實際的數學式統計分配評估完檢定與推定可靠度界限後,可以試著了解使用冒險率(α)或可靠度(1-α)。
後可試著蒐集實際數據(po( Observed )觀察值),比較A與B各自的平均數值與變異數值,若有明顯差異時(依實際改善不良變數,或評估出變因後作適當之工程判斷後,確認是否有明顯差異,切記切記不可直接看數值就下判斷。),即A與B有顯著性。
======
觀(概)念常識,檢定假說:首先主張兩組樣本均相同的(H0),一般我們期望兩組樣本因我們改善後(增加某種向上力量後)有所差異(否定HO)。對改了(增加某種向上力量後)之後有沒有效果做出比對判斷。
H0:檢驗後得到結果是:兩組樣本均相同,確實無差異。
H1:檢驗後得到結果是:兩組樣本不相同,確實有改善,有差異。
第I型錯誤α:於此實際判斷中,指H0是正確的,但我們因為某種小機率變因影響觀察值(PO( Observed )),使我們誤判,認為兩組樣品是不相同,有差異的。
所以說,於此實際判斷中,我們期望改善後(n次觀察檢驗後),因變數逐漸被評估釐清,解決,在工程判斷,及各個利害關係人皆以知曉且許可,讓(觀察)、(調查)、(量測)、(人為)造成的異常所引導造成的錯誤判斷次(將誤判次轉為數值)減少,以便能讓我們的預期的結果接近我們的理想狀態。
第II型錯誤β:指H0是不正確的,但我們誤判為兩組樣品是均相同,確實無差異的機率。
冒險率α又稱為顯著性水準,即表示第I型錯誤α機率,當冒險率為5%而有顯著性時以*記號表示,當冒險率為1%而有顯著性時以**記號表示。
顯著性檢驗:是針對我們對總體所做的假設做檢驗,其原理就是「 某種小機率變因影響事件,我們不能把它當成主要影響因子。」來接受或否定假設。
其α設0.05(5%)含義:是將同一實驗進行100次,兩者結果期望值間的「顯著性檢驗」結果,明顯都是由 某種小機率變因影響因子造成的(在此是100次有5次以上的明顯差異,其實是變因造成的差異),則H0成立,可認為兩組間的差異為不顯著。
但因是用α>5%,所以仍有5%的冒險率α,常記為po>0.05,po( Observed )觀察到,結果因明顯某種小機率變因影響因子造成的差異,在100次>5次,有>5%的機率,造成此觀察值與理論值的差異,
故我們不能把這個因「 某種小機率變因影響事件,把它當成主要影響因子。」來否定(拒絕)(捨棄)觀察值期值本質上是接近理論值的這樣一個主張。
po>p(po>0.05),表示po由誤差引起的發生可能性>5%,你不能把它當作兩者間有「顯著差異」的異常依據,所以接受H0假設,不能否定(拒絕)(捨棄)H0假設,表示兩組間差別無顯著意義。
po<p(po<0.05),若100次中有5次以下的期望值時,否定(拒絕)(捨棄)第I型錯誤α的假設,即認為兩組間的差異有顯著差異。
======
例題:某製程產品母平均μ=21,母標準差σ=4。
製程某一設備改變某一因子後生產一數量的產品,對此改變後的產品作:
抽樣樣本10pcs,樣本平均x ̄=22.5,樣本標準差s≒4。
問此製程是否可認為對某製程某一設備生產的產品己有所改變。
σx=σ/√n=4/√10=1.263,u(常態分布)Z ε%= x ̄ - μ / σx ̄ = 22.5 -21.0 / 1.263 = 1.184 ,'=NORM.S.DIST(Z,1)從-∞~X=0.881793,求曲線外以上故1-ε%=0.118206,=11.82%,也就是此機率曲線每100次有12次的機率是會出現22.5以上的差異性的。
我們來檢定是否與能原始未改變前有所差異,若顯著性檢驗原理: 設定5%,表示若100次內有5次以下,可拒絕H0。
但若像現在100次可看見12次,表示是12>5,表示顯著性檢驗結果變因誤差所影響為12次,故不可拒絕H0,可視為與H0是相同的,近似差異的,無明顯差異的現象。
故以冒險率5%檢定[此製程某一設備生產的產品,在設備改某一因子前與後生產一數量的產品,是可視為接受H0,兩組是是相同的,近似的,無明顯差異的現象。
======
請注意:以下不是探討顯著性水準對理論跟實際量測的影響,而是探討理論數值與量測數值在機率曲線分布上時的評估,檢定通常分為兩側檢定跟單側檢定。
機率曲線內拒絕域的選擇:
拒絕域選擇雙尾:原假設H0:估計量 θ 理論=估計量 θ 量測
拒絕域選擇左單尾開始累積:原假設H0:理論(例95)≧量測(例93)(p>po → (理論涵蓋(包含)量測→H0成立)),(不可能有理論>量測時,H0:理論=量測成立)
拒絕域選擇右單尾:原假設H0:量測≧理論時(po(例7)>p(例5)→H0成立),(不可能有量測>理論時,H0:理論=量測成立,當此時量測被理論涵蓋)
======
(1)決定顯著性水準,(2)設立無效假說,(3)選擇統計量分配,(4)計算抽樣樣本(實踐)(觀察)值,(5)比較樣本計算觀察值(機率曲線)與理論值(機率曲線)。
對母變異數檢定樣本變異數:以χ2分配敘述,'=CHISQ.INV.RT(輸入相似性機率一般是用0.05,自由度),卡方值愈小,表示兩組之間差異小,相似性愈高,不可與顯著性之誤差混淆。
對二組樣本變異數之比作檢定:以F分配敘述,其pU與Pl再用'=F.INV.RT(p值,自由度分子,自由度分母)評估。
對母平均值檢定樣本平均值:以u(常態分布)敘述,用EXCEL的Z ε%=NORM.S.DIST(Z ,1)(Z值表)計算累積機率"。
對二組樣本平均值之差作檢定:以t分配敘述,=TDIST函數可以代替 t 分布的臨界值表
先畫出理論值的機率曲線範圍,再計算觀察值(obserued)的機率曲線範圍,很明顯的,當理論值的機率曲線範圍涵蓋包含計算觀察值的機率曲線範圍,即表示兩者無差別,近似是相同的,無明顯差異現象。
以t分配為例,∣t∣涵蓋∣to∣表示兩者近似相同的沒有差異。(t理論值的機率曲線>to計算觀察值機率曲線→H0成立)。
以χ2分配為例,∣χ2∣涵蓋∣χ2o∣表示兩者近似相同的沒有差異。(χ2理論值的機率曲線>χ2o計算觀察值機率曲線→H0成立)。
以F分配為例,∣F∣涵蓋∣Fo∣表示兩者近似相同的沒有差異。(F理論值的機率曲線>Fo計算觀察值機率曲線→H0成立)。
以μ,σ之u(常態分布),Z ε%為例,∣P雙邊機率(通常取0.05)∣涵蓋∣Fo雙邊機率∣表示兩者近似相同的沒有差異。(理論值的機率曲線>計算觀察值機率曲線)。
======
例題:μ=93.5,σ=3.4,經改良製程後,抽取n=10個樣本,測得樣本平均x ̄=96.2。
不過如果考慮的是單邊機率問題從-∞到x的值z= P(x-μ / σ),如果考慮的是雙邊機率問題-∞~X~+∞,σ(標準差)因為會變成σ^2(變異數),所以在計算z時z= P(x-μ / σ^(1/2))。
Excel 中使用=NORM.S.DIST(Z ,1)(Z值表)
Z =x ̄-μ / σx = x ̄-μ / σ/√n (假設FPC≒1),=96.2-93.5 / 3.4 / √10 = 2.511
使用EXCEL的=NORM.S.DIST(2.511,1)=0.993980計算累積機率
1-NORM.S.DIST(2.511,1)=0.00602。雙邊機率=0.00602X2=0.012=1.2%。
先記住群體平[均值σ=樣品平均值x ̄為:機率曲線中央CL點。然後對p畫出機率分布曲線,然後再對po畫出機率分布曲線,中央CL不變的基點下,會觀察到Po=0.012的曲線必須畫在P=0.05之內。
比對P=0.05,Po=0.012,所以使用新製程的前後比對的結果是:理論值的機率曲線>計算觀察值機率曲線,所以是可視為接受H0,兩製程是相同的,近似的,無明顯差異的現象。
網路上找的一個題目 :
公賣局宣稱長壽牌香菸所含尼古丁平均不超過3.5毫克,今抽驗8支長壽牌香菸,測出所含尼古丁平均值為4.2毫克,標準差=1.4。
若長壽牌香菸尼古丁含量呈常態分配,試以顯著水準0.01來檢定公賣局宣稱是否正確無造假。
以下用EXCEL表格計算,目前支援到10個樣本,
μ≦3.5,H0成立。μ>3.5,H1成立。
群體平均值= 3.5
雙側顯著水準= 0.01
樣本數= 8
自由度= 7
no. | x | X | X ^2 |
1 | 5.9 | 1.675 | 2.805625 |
2 | 4.2 | -0.025 | 0.000625 |
3 | 5.4 | 1.175 | 1.380625 |
4 | 3.4 | -0.825 | 0.680625 |
5 | 3.3 | -0.9 | 0.855625 |
6 | 2.9 | -1.325 | 1.755625 |
7 | 2.6 | -1.625 | 2.640625 |
8 | 6.1 | 1.875 | 3.515625 |
9 | |||
10 | |||
樣品平均 | 4.2 | ||
標準差 | 1.4 | ||
加總 | 33.8 | -3.9968E-15 | 13.64 |
S(偏差平方和)= ΣX^2 - (ΣX )^2 } / n
S=13.635
σe=√V =√ S(偏差平方和) / n-1
σe=1.3956565
tφ(α冒險率)=使用EXCEL的=T.INV.2T(α,φ)
tφ(α)=3.4994833
故信賴區間0.99%=x ̄±( tφ(α)(* σe / √n)
即:pU=5.95
即:PL=2.50
表示樣品 x ̄平均值介於上限與下限間皆合理。
或用之前用估計平均值的方法:Z =x ̄-μ / s/ √n的方式:
x ̄=(Z*(s/ √n))+μ
x ̄=5.2
因為5.2>4.2所以P>Po接受H0。
表示說樣品的平均值4.2是被包含在群體估計樣本的平均值5.2中。
沒有留言:
張貼留言