2023年1月3日 星期二

相關與迴歸分析:變異數分析分析-排列組合機率82

 (以下書中筆記心得摘錄內容及例題來自為:發行時間於民國75年一月,由中興管理顧問公司發行,書名:品質管制與工廠統計一書,譯者:陳文哲(現任國立交通大學管理科學研究所專任教授),黃清連(中國鋼鐵股份有限公司技術開發處長)。原著者為中井重行(早稻田大學工業經營科主任),池澤辰夫(早稻田大學工學教授)。


當事情發生時,我們會去找導致事情發生的原因。但原因是偶然還是必然呢?


改變的效果通常會=某因子造成之效果+誤差導致。


誤差SE=變異數VE。


因子造成之效果SA=變異數VA。


於是:我們實施變異數分析之檢定(F檢定),可先設定H0假說為:「VA=VE」,若真得分析計算出來「VA=VE」時,則表示所提之測試變音為無效變因,此檢驗其實剛開時評估時就可以評估不須做,但是已經做完了。


一元配置法:
一元配置法:我們假定溫度(主要因子)會影響效率,則總(全)改變的效率S=組間變動SA+組內變動SE。[改變的效果通常會=((主要因子造成之效果)+誤差導致。]


二元配置法:
二元配置法:我們假定設備(A因子)+材料(B因子)會影響效率,則總(全)改變的效率S=組間變動SA+組內變動SE。(改變的效果通常會=[(設備效果+材料效果+設備與材料交互作用的效果)+誤差導致。]


一元配置法的分析計算法:

我們想要看是否有顯著差異,在實驗計畫裡,初步評估變因是有顯著的,初步評估變因這裡,假設是會造成某種趨近常態分布(F分析)的,初步剃除其他不明顯的人、機、料、法、環其餘因子造成的誤差干涉後,已經確認以上幾點後,進行下面由結果回推(邏輯迴歸)及(逆向歸納法)


https://wiki.mbalib.com/zh-tw/%E9%80%86%E5%90%91%E5%BD%92%E7%BA%B3%E6%B3%95
逆向歸納法:它的精髓就是“向前展望,向後推理”,即首先仔細思考自己的決策可能引起的所有後續反應,以及後續反應的後續反應,直至博弈結束;然後從最後一步開始,逐步倒推,以此找出自己在每一步的最優選擇。


如上所述,若Fo>F則認為有差異(中心CL平均相等,常態趨勢不變(機率近似),FO觀察包含F理論):


如果已知良與不良品的比例,可推定該製程不良率之可靠界限。所以我需要各組的變因的自由度(參考前章節使用f分配區間分布)


信賴可靠度上限pU


pU= φ1 * F(φ1/φ2) (α/2)  /  φ2 + φ1 * F(φ1/φ2)


pU之φ1=2 (r+1),φ2=2 (n-r)



信賴可靠度閜限pL


pL= φ2  /  φ2 + φ1 * F(φ1/φ2)


pL之φ1=2 (n-r+1),φ2=2r


例如: φ=全部數據自由度, φA=組間變動數據自由度, φE=組內變動數據自由度。


然後如果,還覺得沒有用到檢定的話:可以求不(無)偏變異數(參考前章節)


不偏變異數V=偏差(變異)平方和 S/ 自由度 φ


用S全部數據偏差平方和=SA組間變動數據平方和+SE組內變動數據平方和。以求出SE=多少。SE=S-SA。


VA=SA/φA,VE=SE/φE。這樣你的S,SA,SE,依序就都求出來了。


別忘了前面,我們實施變異數分析之檢定(F檢定),可先設定H0假說為:「VA=VE」,所以FO=VA/VE是我們觀察的F分析的分母與分子的比值。求出FO=VA/VE的值。


那F的分母比分子的比值呢?假設冒險率=5%,自由度是: φA=組間變動數據自由度, φE=組內變動數據自由度。,這樣去比值F(φAφE)(0.05)也求出來了。


如上所述,若Fo>F則認為有差異(中心CL平均相等,常態趨勢不變(機率近似),FO觀察包含F理論):



那上述的S跟SA要怎麼計算:

SA=組間變動數據平方和=[(A因子第一組各次對B方法之量測數據相加總)^2) / 反覆次數]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2/ 反覆次數] - CF修正項。


S=[(A因子第一組各次對B方法之量測數據相加總)^2) ]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2] - CF修正項。


SE=S-SA


CF修正項=同上所述,以各組之各次數據相加總後再加總之總和T之平方再被全數據之次數N除之,CF=T^2/N。



最後你可能要選擇最佳的A因子對B方法的影響中,作統計品質判斷的最佳判斷選定。


需要用到估計母平均μ^(μ頭上加個^表示估計θ),用簡化(內涵意義相同)μ^=總和S/數樣本數(平均值的概念,EXCEL圖形用Y軸,故用B方法,或是結果推論的總和,(設置圖形方式參考前章節迴歸趨勢線分布)))


有了估計母平均,就可以用EXECL畫圖,但是若要更多判定條件,還可以再考慮將(不(無)偏差變異數之平方根σe=√V加入(參考前章可靠度信賴區間),看看相近的各組的母平均其變異值狀態,再來判定。


母變異數σ^2未知時,平均值 x ̄ ±  tφ(α) σe / √n 。所以對VE來講,就是:可靠度信賴區間βj=tφE(α) √VE  / √n,然後得到的值跟各組母平均μ^結合。


將各組的數值及可靠度區間為:μa(第一組)^±βj ,μb(第一組)^±βj ,… ,μn(最後一組)^±βj 。使用excel圖表繪製出來進行比對。


最後完成:最佳的A因子對B方法的影響中,作統計品質判斷的最佳判斷選定,作統計品質判斷的最佳判斷選定。誰說,品質管制系統沒有類似研發審查,工程判斷,製程技術評估這樣的東西,這個就可以是了。


而且還是用數字跟圖表會說話的方式,進行多層次的判斷,你想評估判斷分析到哪一層,都隨你在實務上所需而變動,而且,在EXCEL上做統計分析,還可以隨你心意,觀察最終結果的不同趨勢,以便能更精準的

比開直覺與經驗的不足,讓所有沒有學過的初學者,學會修正開頭,便知道結果如何修正。


以上是變異數分析,使用一元配置法的方法。為將數據之全部變異分成若干變因,對各要因之變異做推估跟檢定,對其餘之變異誤差做推估跟檢定。



必須知道了原理後,並不要求一定會計算,而是這樣子再去使用統計學軟體,一定比較清楚軟體在做甚麼事。



例題:


 

A因子
第一組

A因子
第二組

A因子
第三組

A因子
第四組

第一次

2

-11

12

-2

第二次

-14

-14

8

-4

第三次

2

-11

19

31

第四次

-11

-11

19

-11

平方
合計SUMSQ

325

559

930

1102

總計SUM

-21

-47

58

14

總計之
總和T

4

=SUM

(B86:E86)

 

修正CF

1

=(B87^2)

/COUNTA

(B81:E84)

各總計
後平方

441

2209

3364

196

平方後
總計加總

2916

=SUM

(B85:E85)

全數據
平方總計



S=[(A因子第一組各次對B方法之量測數據相加總)^2) ]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2] - CF修正項。


S=2916-1。S=2915


SA=組間變動數據平方和=[(A因子第一組各次對B方法之量測數據相加總)^2) / 反覆次數]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2/ 反覆次數] - CF修正項。


SA=[ (441/4) +  (2209/4) + (3364/4) + (196/4) ] - 1  。SA= 1551.5 


SE = S-SA = 2915 -1551.5 。SE=1363.5


 φ=全部數據自由度=16-1=15。 φA=組間變動數據自由度=4-1=3 。φ E=組內變動數據自由度= φ-φA。 φ E=15-3=12。


VA=SA/φA。VA=1551.5/3=517.17。


VE=SE/φE。VE=1363.5/12=113.62。


FO=VA/VE。FO=517.17/113.62=4.55。


F(φAφE)(0.05)=F(3/12)(0.05)=3.49。


=F.INV.RT(p值,分子,分母)


F.INV.RT(0.05,3,12)=3.4902948194976


比較FO跟F:FO=4.55 > F=3.49 ,所以有顯著之差異。不同A因子在對此製程之影響並非未知誤差形成之偶然,有近似主因子之影響能力程度。


至於程度:可以觀察將各組的數值及可靠度區間為:μa(第一組)^±βj ,μb(第一組)^±βj ,… ,μn(最後一組)^±βj 。使用excel圖表繪製出來進行比對。


μ^第一組=-21/4,μ^第二組=-47/4,μ^第三組=58/4,μ^第四組=14/4。


βj=tφE(α) √VE  / √n


tφE(α)=T.INV.2T(0.05,12)=2.17881282966723


βj=2.18 *(√113.62  / √4)=11.62


μa^±βj
μ第一組=-5.02±11.62
μ第二組=-11.75±11.62
μ第三組=14.5±11.62
μ四組=3.5±11.62

畫出EXCEL圖表,,依圖表選項,選誤差線,可以直接畫區間,顯示情況判定。


二元配置分析

有重複之實驗
要因
A
B
交互作用
組間
誤差
全變動

不偏變異數
VA
VB
VAxB
VE

要因A之FO=VA/VE

要因B之FO=VB/VE

A與B交互作用之FO=V*B/VE


要因A之F=F(φA/φE)(α)

要因B之F=F(φB/φE)(α)

如上所述,若Fo>F則認為有差異,F>Fo則認為無差異。


例題:


設備A1

設備A2

員工1
第一次

95

-58

員工1
第二次

58

-59

員工2
第一次

51

-84

員工2
第二次

76

-76

員工3
第一次

48

96

員工3
第二次

23

89


(全數據總和)^2=12321

修正項CF=12321/12=1027

各數據平方總和=60413

總平方和S=60413-1027=59386

組間變動SAB=(重複數據和之平方總計/重複次數)-CF=(118093/2)-1027=58020。

誤差變動SE=S-SAB=1366。

設備之誤差變動SA=[(各列之平方總和) / (重複次數)X(次數)] -CF =55081

員工之誤差變動SB=[(各列之平方總和) / (重複次數)X(次數)] -CF =2818

交互作用SAxB=SAB-SA-SB=121

各變動之自由度

φA=N-1=(2X3X2)-1=11。N=( k x l x r )

φA=2-1=1

φB=3-1=2

φE=2X3X(2-1)=6

φAB=φ-φE=5

φAxB=φAB-φA-φB=2

VA=SA/φA=55081/1=55081

VA=SB/φB=2818/2=1409

VAxB=SAxB / φAxB=121/2=61

VE=SE /φE=1366/6=227.7

設備之FO=VA/VE=241.9

員工之FO=VB/VE=6.2

交互作用之FO=VAxB/VE=0.268

若以α=0.01判定差異性

設備之要因A之F=F(φA/φE)(α)=13.7

員工之要因B之F=F(φB/φE)(α)=10.9

如上所述,則設備之要因Fo>F則認為有顯著差異,而員工之要因F>Fo則認為無顯著差異。

結論:此次調查設備與工作員工對產品產量之影響結果:以α=1%檢定,認為設備間有顯著差異,員工操作間無顯著差異。

接下來的數據及管制圖製作,不會分類在排列與組合與機率這裡,會分類放在數學常識那裏。

但管制圖製作,在前篇的期望值與估計母(群)體母標準差σ那邊,為了估計母數的出現,而對趨勢曲線給予了c2與d2兩個依樣本n大小而異的係數。

沒有留言:

張貼留言