2022年12月31日 星期六

檢定與推定可靠度界限之問題有很密切之關係,變異數檢定用χ2分配與F分配,平均值檢定則用常態分配與t分配。-排列組合機率79

(以下書中筆記心得摘錄內容及例題來自為:發行時間於民國75年一月,由中興管理顧問公司發行,書名:品質管制與工廠統計一書,譯者:陳文哲(現任國立交通大學管理科學研究所專任教授),黃清連(中國鋼鐵股份有限公司技術開發處長)。原著者為中井重行(早稻田大學工業經營科主任),池澤辰夫(早稻田大學工學教授)。


從使用-排列組合機率68開始至今,能夠符合實際的數學式統計分配評估完檢定與推定可靠度界限後,可以試著了解使用冒險率(α)或可靠度(1-α)。

後可試著蒐集實際數據(po( Observed )觀察值),比較A與B各自的平均數值與變異數值,若有明顯差異時(依實際改善不良變數,或評估出變因後作適當之工程判斷後,確認是否有明顯差異,切記切記不可直接看數值就下判斷。),即A與B有顯著性。

======

觀(概)念常識,檢定假說:首先主張兩組樣本均相同的(H0),一般我們期望兩組樣本因我們改善後(增加某種向上力量後)有所差異(否定HO)。對改了(增加某種向上力量後)之後有沒有效果做出比對判斷。


H0:檢驗後得到結果是:兩組樣本均相同,確實無差異。
H1:檢驗後得到結果是:兩組樣本不相同,確實有改善,有差異。



第I型錯誤α:於此實際判斷中,指H0是正確的,但我們因為某種小機率變因影響觀察值(PO( Observed )),使我們誤判,認為兩組樣品是不相同,有差異的。

所以說,於此實際判斷中,我們期望改善後(n次觀察檢驗後),因變數逐漸被評估釐清,解決,在工程判斷,及各個利害關係人皆以知曉且許可,讓(觀察)、(調查)、(量測)、(人為)造成的異常所引導造成的錯誤判斷次(將誤判次轉為數值)減少,以便能讓我們的預期的結果接近我們的理想狀態。


第II型錯誤β:指H0是不正確的,但我們誤判為兩組樣品是均相同,確實無差異的機率。


冒險率α又稱為顯著性水準,即表示第I型錯誤α機率,當冒險率為5%而有顯著性時以*記號表示,當冒險率為1%而有顯著性時以**記號表示。


顯著性檢驗:是針對我們對總體所做的假設做檢驗,其原理就是「 某種小機率變因影響事件,我們不能把它當成主要影響因子。」來接受或否定假設。


其α設0.05(5%)含義:是將同一實驗進行100次,兩者結果期望值間的「顯著性檢驗」結果,明顯都是由 某種小機率變因影響因子造成的(在此是100次有5次以上的明顯差異,其實是變因造成的差異),則H0成立,可認為兩組間的差異為不顯著。

但因是用α>5%,所以仍有5%的冒險率α,常記為po>0.05,po( Observed )觀察到,結果因明顯某種小機率變因影響因子造成的差異,在100次>5次,有>5%的機率,造成此觀察值與理論值的差異,

故我們不能把這個因「 某種小機率變因影響事件,把它當成主要影響因子。」來否定(拒絕)(捨棄)觀察值期值本質上是接近理論值的這樣一個主張。

po>p(po>0.05),表示po由誤差引起的發生可能性>5%,你不能把它當作兩者間有「顯著差異」的異常依據,所以接受H0假設,不能否定(拒絕)(捨棄)H0假設,表示兩組間差別無顯著意義。


po<p(po<0.05),若100次中有5次以下的期望值時,否定(拒絕)(捨棄)第I型錯誤α的假設,即認為兩組間的差異有顯著差異。

======


例題:某製程產品母平均μ=21,母標準差σ=4。


製程某一設備改變某一因子後生產一數量的產品,對此改變後的產品作:
抽樣樣本10pcs,樣本平均x ̄=22.5,樣本標準差s≒4。
問此製程是否可認為對某製程某一設備生產的產品己有所改變。

σx=σ/√n=4/√10=1.263,u(常態分布)Z ε%=  x ̄  -  μ  /    σx ̄  = 22.5 -21.0 / 1.263  = 1.184 ,'=NORM.S.DIST(Z,1)從-∞~X=0.881793,求曲線外以上故1-ε%=0.118206,=11.82%,也就是此機率曲線每100次有12次的機率是會出現22.5以上的差異性的。


我們來檢定是否與能原始未改變前有所差異,若顯著性檢驗原理: 設定5%,表示若100次內有5次以下,可拒絕H0。


但若像現在100次可看見12次,表示是12>5,表示顯著性檢驗結果變因誤差所影響為12次,故不可拒絕H0,可視為與H0是相同的,近似差異的,無明顯差異的現象。


故以冒險率5%檢定[此製程某一設備生產的產品,在設備改某一因子前與後生產一數量的產品,是可視為接受H0,兩組是是相同的,近似的,無明顯差異的現象。

======

請注意:以下不是探討顯著性水準對理論跟實際量測的影響,而是探討理論數值與量測數值在機率曲線分布上時的評估,檢定通常分為兩側檢定跟單側檢定。



機率曲線內拒絕域的選擇:
拒絕域選擇雙尾:原假設H0:估計量 θ 理論=估計量 θ 量測


拒絕域選擇左單尾開始累積:原假設H0:理論(例95)≧量測(例93)(p>po → (理論涵蓋(包含)量測→H0成立)),(不可能有理論>量測時,H0:理論=量測成立)


拒絕域選擇右單尾:原假設H0:量測≧理論時(po(例7)>p(例5)→H0成立),(不可能有量測>理論時,H0:理論=量測成立,當此時量測被理論涵蓋)


======
(1)決定顯著性水準,(2)設立無效假說,(3)選擇統計量分配,(4)計算抽樣樣本(實踐)(觀察)值,(5)比較樣本計算觀察值(機率曲線)與理論值(機率曲線)。


對母變異數檢定樣本變異數:以χ2分配敘述,'=CHISQ.INV.RT(輸入相似性機率一般是用0.05,自由度),卡方值愈小,表示兩組之間差異小,相似性愈高,不可與顯著性之誤差混淆。
對二組樣本變異數之比作檢定:以F分配敘述,其pU與Pl再用'=F.INV.RT(p值,自由度分子,自由度分母)評估。
對母平均值檢定樣本平均值:以u(常態分布)敘述,用EXCEL的Z ε%=NORM.S.DIST(Z ,1)(Z值表)計算累積機率"。
對二組樣本平均值之差作檢定:以t分配敘述,=TDIST函數可以代替 t 分布的臨界值表


先畫出理論值的機率曲線範圍,再計算觀察值(obserued)的機率曲線範圍,很明顯的,當理論值的機率曲線範圍涵蓋包含計算觀察值的機率曲線範圍,即表示兩者無差別,近似是相同的,無明顯差異現象。


以t分配為例,∣t∣涵蓋∣to∣表示兩者近似相同的沒有差異。(t理論值的機率曲線>to計算觀察值機率曲線→H0成立)。


以χ2分配為例,∣χ2∣涵蓋∣χ2o∣表示兩者近似相同的沒有差異。(χ2理論值的機率曲線>χ2o計算觀察值機率曲線→H0成立)。


以F分配為例,∣F∣涵蓋∣Fo∣表示兩者近似相同的沒有差異。(F理論值的機率曲線>Fo計算觀察值機率曲線→H0成立)。


以μ,σ之u(常態分布),Z ε%為例,∣P雙邊機率(通常取0.05)∣涵蓋∣Fo雙邊機率∣表示兩者近似相同的沒有差異。(理論值的機率曲線>計算觀察值機率曲線)。


======


例題:μ=93.5,σ=3.4,經改良製程後,抽取n=10個樣本,測得樣本平均x ̄=96.2。


不過如果考慮的是單邊機率問題從-∞到x的值z= P(x-μ / σ),如果考慮的是雙邊機率問題-∞~X~+∞,σ(標準差)因為會變成σ^2(變異數),所以在計算z時z= P(x-μ / σ^(1/2))。
Excel 中使用=NORM.S.DIST(Z ,1)(Z值表)
Z =x ̄-μ / σx = x ̄-μ / σ/√n (假設FPC≒1),=96.2-93.5  /  3.4  /  √10 = 2.511


使用EXCEL的=NORM.S.DIST(2.511,1)=0.993980計算累積機率
1-NORM.S.DIST(2.511,1)=0.00602。雙邊機率=0.00602X2=0.012=1.2%。

先記住群體平[均值σ=樣品平均值x ̄為:機率曲線中央CL點。然後對p畫出機率分布曲線,然後再對po畫出機率分布曲線,中央CL不變的基點下,會觀察到Po=0.012的曲線必須畫在P=0.05之內。


比對P=0.05,Po=0.012,所以使用新製程的前後比對的結果是:理論值的機率曲線>計算觀察值機率曲線,所以是可視為接受H0,兩製程是相同的,近似的,無明顯差異的現象。



網路上找的一個題目  :
公賣局宣稱長壽牌香菸所含尼古丁平均不超過3.5毫克,今抽驗8支長壽牌香菸,測出所含尼古丁平均值為4.2毫克,標準差=1.4。    
若長壽牌香菸尼古丁含量呈常態分配,試以顯著水準0.01來檢定公賣局宣稱是否正確無造假。    
    

以下用EXCEL表格計算,目前支援到10個樣本,


μ≦3.5,H0成立。μ>3.5,H1成立。    
群體平均值=    3.5
雙側顯著水準=    0.01
樣本數=    8
自由度=    7

no.

x

X

X ^2

1

5.9

1.675

2.805625

2

4.2

-0.025

0.000625

3

5.4

1.175

1.380625

4

3.4

-0.825

0.680625

5

3.3

-0.9

0.855625

6

2.9

-1.325

1.755625

7

2.6

-1.625

2.640625

8

6.1

1.875

3.515625

9




10




樣品平均

4.2



標準差

1.4



加總

33.8

-3.9968E-15

13.64


S(偏差平方和)=  ΣX^2   - (ΣX )^2 }  / n 
S=13.635


σe=√V =√ S(偏差平方和) / n-1
σe=1.3956565


 tφ(α冒險率)=使用EXCEL的=T.INV.2T(α,φ)
 tφ(α)=3.4994833
故信賴區間0.99%=x ̄±(   tφ(α)(*  σe /  √n)


即:pU=5.95
即:PL=2.50
表示樣品 x ̄平均值介於上限與下限間皆合理。


或用之前用估計平均值的方法:Z =x ̄-μ / s/ √n的方式:

x ̄=(Z*(s/ √n))+μ
x ̄=5.2
因為5.2>4.2所以P>Po接受H0。
表示說樣品的平均值4.2是被包含在群體估計樣本的平均值5.2中。

沒有留言:

張貼留言