銘記星辰之下: 相關與迴歸分析：變異數分析分析-排列組合機率82

(以下書中筆記心得摘錄內容及例題來自為：發行時間於民國75年一月，由中興管理顧問公司發行，書名：品質管制與工廠統計一書，譯者：陳文哲(現任國立交通大學管理科學研究所專任教授)，黃清連(中國鋼鐵股份有限公司技術開發處長)。原著者為中井重行(早稻田大學工業經營科主任)，池澤辰夫(早稻田大學工學教授)。

當事情發生時，我們會去找導致事情發生的原因。但原因是偶然還是必然呢？

改變的效果通常會=某因子造成之效果+誤差導致。

誤差SE=變異數VE。

因子造成之效果SA=變異數VA。

於是：我們實施變異數分析之檢定(F檢定)，可先設定H0假說為：「VA=VE」，若真得分析計算出來「VA=VE」時，則表示所提之測試變音為無效變因，此檢驗其實剛開時評估時就可以評估不須做，但是已經做完了。

一元配置法：
一元配置法：我們假定溫度(主要因子)會影響效率，則總(全)改變的效率S=組間變動SA+組內變動SE。[改變的效果通常會=((主要因子造成之效果)+誤差導致。]

二元配置法：
二元配置法：我們假定設備(A因子)+材料(B因子)會影響效率，則總(全)改變的效率S=組間變動SA+組內變動SE。(改變的效果通常會=[(設備效果+材料效果+設備與材料交互作用的效果)+誤差導致。]

一元配置法的分析計算法：

我們想要看是否有顯著差異，在實驗計畫裡，初步評估變因是有顯著的，初步評估變因這裡，假設是會造成某種趨近常態分布(F分析)的，初步剃除其他不明顯的人、機、料、法、環其餘因子造成的誤差干涉後，已經確認以上幾點後，進行下面由結果回推(邏輯迴歸)及(逆向歸納法)。

https://wiki.mbalib.com/zh-tw/%E9%80%86%E5%90%91%E5%BD%92%E7%BA%B3%E6%B3%95
逆向歸納法：它的精髓就是“向前展望，向後推理”，即首先仔細思考自己的決策可能引起的所有後續反應，以及後續反應的後續反應，直至博弈結束；然後從最後一步開始，逐步倒推，以此找出自己在每一步的最優選擇。

如上所述，若Fo>F則認為有差異(中心CL平均相等，常態趨勢不變(機率近似)，FO觀察包含F理論)：

如果已知良與不良品的比例，可推定該製程不良率之可靠界限。所以我需要各組的變因的自由度(參考前章節使用f分配區間分布)

信賴可靠度上限pU

pU= φ1 * F(φ1/φ2) (α/2) / φ2 + φ1 * F(φ1/φ2)

pU之φ1=2 (r＋1)，φ2=2 (n－r)

信賴可靠度閜限pL

pL= φ2 / φ2 + φ1 * F(φ1/φ2)

pL之φ1=2 (n-r＋1)，φ2=2r

例如： φ=全部數據自由度， φA=組間變動數據自由度， φE=組內變動數據自由度。

然後如果，還覺得沒有用到檢定的話：可以求不(無)偏變異數(參考前章節)

不偏變異數V=偏差(變異)平方和 S/ 自由度 φ

用S全部數據偏差平方和=SA組間變動數據平方和+SE組內變動數據平方和。以求出SE=多少。SE=S-SA。

VA=SA/φA，VE=SE/φE。這樣你的S，SA，SE，依序就都求出來了。

別忘了前面，我們實施變異數分析之檢定(F檢定)，可先設定H0假說為：「VA=VE」，所以FO=VA/VE是我們觀察的F分析的分母與分子的比值。求出FO=VA/VE的值。

那F的分母比分子的比值呢？假設冒險率=5%，自由度是： φA=組間變動數據自由度， φE=組內變動數據自由度。，這樣去比值F(φAφE)(0.05)也求出來了。

如上所述，若Fo>F則認為有差異(中心CL平均相等，常態趨勢不變(機率近似)，FO觀察包含F理論)：

那上述的S跟SA要怎麼計算：

SA=組間變動數據平方和=[(A因子第一組各次對B方法之量測數據相加總)^2) / 反覆次數]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2/ 反覆次數] - CF修正項。

S=[(A因子第一組各次對B方法之量測數據相加總)^2) ]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2] - CF修正項。

SE=S-SA

CF修正項=同上所述，以各組之各次數據相加總後再加總之總和T之平方再被全數據之次數N除之，CF=T^2/N。

最後你可能要選擇最佳的A因子對B方法的影響中，作統計品質判斷的最佳判斷選定。

需要用到估計母平均μ^(μ頭上加個^表示估計θ)，用簡化(內涵意義相同)μ^=總和S/數樣本數(平均值的概念，EXCEL圖形用Y軸，故用B方法，或是結果推論的總和，(設置圖形方式參考前章節迴歸趨勢線分布)))

有了估計母平均，就可以用EXECL畫圖，但是若要更多判定條件，還可以再考慮將(不(無)偏差變異數之平方根σe=√V加入(參考前章可靠度信賴區間)，看看相近的各組的母平均其變異值狀態，再來判定。

母變異數σ^2未知時，平均值 x￣ ± tφ(α) σe / √n 。所以對VE來講，就是：可靠度信賴區間βj=tφE(α) √VE / √n，然後得到的值跟各組母平均μ^結合。

將各組的數值及可靠度區間為：μa(第一組)^±βj ，μb(第一組)^±βj ，… ，μn(最後一組)^±βj 。使用excel圖表繪製出來進行比對。

最後完成：最佳的A因子對B方法的影響中，作統計品質判斷的最佳判斷選定，作統計品質判斷的最佳判斷選定。誰說，品質管制系統沒有類似研發審查，工程判斷，製程技術評估這樣的東西，這個就可以是了。

而且還是用數字跟圖表會說話的方式，進行多層次的判斷，你想評估判斷分析到哪一層，都隨你在實務上所需而變動，而且，在EXCEL上做統計分析，還可以隨你心意，觀察最終結果的不同趨勢，以便能更精準的

比開直覺與經驗的不足，讓所有沒有學過的初學者，學會修正開頭，便知道結果如何修正。

以上是變異數分析，使用一元配置法的方法。為將數據之全部變異分成若干變因，對各要因之變異做推估跟檢定，對其餘之變異誤差做推估跟檢定。

必須知道了原理後，並不要求一定會計算，而是這樣子再去使用統計學軟體，一定比較清楚軟體在做甚麼事。

例題：

	A因子第一組	A因子第二組	A因子第三組	A因子第四組
第一次	2	-11	12	-2
第二次	-14	-14	8	-4
第三次	2	-11	19	31
第四次	-11	-11	19	-11
平方合計SUMSQ	325	559	930	1102
總計SUM	-21	-47	58	14
總計之總和T	4	=SUM	(B86:E86)
修正CF	1	=(B87^2)	/COUNTA	(B81:E84)
各總計後平方	441	2209	3364	196
平方後總計加總	2916	=SUM	(B85:E85)	全數據平方總計

S=[(A因子第一組各次對B方法之量測數據相加總)^2) ]+…+[(A因子最後一組各次對B方法之量測數據相加總 )^2] - CF修正項。

S=2916-1。S=2915

SA=[ (441/4) + (2209/4) + (3364/4) + (196/4) ] - 1 。SA= 1551.5

SE = S-SA = 2915 -1551.5 。SE=1363.5

φ=全部數據自由度=16-1=15。 φA=組間變動數據自由度=4-1=3 。φ E=組內變動數據自由度= φ-φA。 φ E=15-3=12。

VA=SA/φA。VA=1551.5/3=517.17。

VE=SE/φE。VE=1363.5/12=113.62。

FO=VA/VE。FO=517.17/113.62=4.55。

F(φAφE)(0.05)=F(3/12)(0.05)=3.49。

=F.INV.RT(p值,分子,分母)

F.INV.RT(0.05,3,12)=3.4902948194976

比較FO跟F：FO=4.55 ＞ F=3.49 ，所以有顯著之差異。不同A因子在對此製程之影響並非未知誤差形成之偶然，有近似主因子之影響能力程度。

至於程度：可以觀察將各組的數值及可靠度區間為：μa(第一組)^±βj ，μb(第一組)^±βj ，… ，μn(最後一組)^±βj 。使用excel圖表繪製出來進行比對。

μ^第一組=-21/4，μ^第二組=-47/4，μ^第三組=58/4，μ^第四組=14/4。

βj=tφE(α) √VE / √n

tφE(α)=T.INV.2T(0.05,12)=2.17881282966723

βj=2.18 *(√113.62 / √4)=11.62

μa^±βj
μ第一組=-5.02±11.62
μ第二組=-11.75±11.62
μ第三組=14.5±11.62
μ四組=3.5±11.62

畫出EXCEL圖表，，依圖表選項，選誤差線，可以直接畫區間，顯示情況判定。

二元配置分析

有重複之實驗
要因
A
B
交互作用
組間
誤差
全變動

不偏變異數
VA
VB
VAxB
VE

要因A之FO=VA/VE

要因B之FO=VB/VE

A與B交互作用之FO=V*B/VE

要因A之F=F(φA/φE)(α)

要因B之F=F(φB/φE)(α)

如上所述，若Fo>F則認為有差異，F>Fo則認為無差異。

例題：

	設備A1	設備A2
員工1 第一次	95	-58
員工1 第二次	58	-59
員工2 第一次	51	-84
員工2 第二次	76	-76
員工3 第一次	48	96
員工3 第二次	23	89

(全數據總和)^2=12321

修正項CF=12321/12=1027

各數據平方總和=60413

總平方和S=60413-1027=59386

組間變動SAB=(重複數據和之平方總計/重複次數)-CF=(118093/2)-1027=58020。

誤差變動SE=S-SAB=1366。

設備之誤差變動SA=[(各列之平方總和) / (重複次數)X(次數)] -CF =55081

員工之誤差變動SB=[(各列之平方總和) / (重複次數)X(次數)] -CF =2818

交互作用SAxB=SAB-SA-SB=121

各變動之自由度

φA=N-1=(2X3X2)-1=11。N=( k x l x r )

φA=2-1=1

φB=3-1=2

φE=2X3X(2-1)=6

φAB=φ-φE=5

φAxB=φAB-φA-φB=2

VA=SA/φA=55081/1=55081

VA=SB/φB=2818/2=1409

VAxB=SAxB / φAxB=121/2=61

VE=SE /φE=1366/6=227.7

設備之FO=VA/VE=241.9

員工之FO=VB/VE=6.2

交互作用之FO=VAxB/VE=0.268

若以α=0.01判定差異性

設備之要因A之F=F(φA/φE)(α)=13.7

員工之要因B之F=F(φB/φE)(α)=10.9

如上所述，則設備之要因Fo>F則認為有顯著差異，而員工之要因F>Fo則認為無顯著差異。

結論：此次調查設備與工作員工對產品產量之影響結果：以α=1%檢定，認為設備間有顯著差異，員工操作間無顯著差異。

接下來的數據及管制圖製作，不會分類在排列與組合與機率這裡，會分類放在數學常識那裏。

但管制圖製作，在前篇的期望值與估計母(群)體母標準差σ那邊，為了估計母數的出現，而對趨勢曲線給予了c2與d2兩個依樣本n大小而異的係數。

銘記星辰之下

相關與迴歸分析：變異數分析分析-排列組合機率82

沒有留言:

張貼留言

一種是被外力干涉後產生的結果，另一種則是自然發生的結果。