銘記星辰之下: 信賴區間推定-小樣本使用總偏差平方和及T分布敘述信賴區間-排列組合機率78

當符合足夠抽樣比時，這樣就可以使用標準常態分布方式來計算偏倚信賴區間：即Z{0.025}=1.96，

偏倚區間=x￣(標準差)±(σx￣(標準誤差)X Z值（標準常態分佈Ｕ的某點的值))
使用EXCEL=NORM.S.DIST(Z,1)

Z	=NORM.S.DIST(Z,1)	2ε以α 表示稱為冒險率	1-α= 可靠度 (信賴區間)
1.96	0.975	0.050	95.0%
2.58	0.995	0.010	99.0%
1	0.841	0.317	68.3%
2	0.977	0.046	95.4%
3	0.999	0.003	99.7%
0.68	0.752	0.497	50.3%
1.65	0.951	0.099	90.1%
0.85	0.802	0.395	60.5%
1.04	0.851	0.298	70.2%
1.15	0.875	0.250	75.0%
1.29	0.901	0.197	80.3%
1.44	0.925	0.150	85.0%

達常態分佈時：

Z值取取1.96，表示信賴區間95%
Z值取取2.58，表示信賴區間99%
Z值取取1，表示信賴區間68.3%(±1標準差常用)
Z值取取2，表示信賴區間95.4%(±2標準差常用)
Z值取取3，表示信賴區間99.7%(±3標準差常用)
Z值取取0.68，表示信賴區間50%(有5成機率涵蓋)
Z值取取0.85，表示信賴區間60%(有6成機率涵蓋)
Z值取取1.04，表示信賴區間70%(有7成機率涵蓋)
Z值取取1.15，表示信賴區間75%(有7成半機率涵蓋)
Z值取取1.29，表示信賴區間80%(有8成機率涵蓋)
Z值取取1.44，表示信賴區間85%(有8成半機率涵蓋)
Z值取取1.65，表示信賴區間90%(有9成機率涵蓋)
Z值取取1.96，表示信賴區間95%(有9成半機率涵蓋)
Z值取取2.58，表示信賴區間99%(有9成9機率涵蓋)

請注意σx￣(標準誤差)有三種型式考量樣本大小與群(母)體的推估方法。
偏倚區間=x￣(標準差)±(σx￣(標準誤差)X Z值（標準常態分佈Ｕ的某點的值)
以(μ，σ^2 / N)的常態分佈Ｕ的某點區間推定：x￣－σx￣ *Ｚ＜μ＜ x￣＋σx￣ *Ｚ。

簡例：某製造過程良率分布已能達常態分佈時，已知群(母)體標準差σ為2.4。其抽驗4個樣品，樣本平均x￣=28.9，不考慮樣本與母體差距，以無限群體方式設FPC。
則：求標準差95%信賴區間為如何敘述：
Z值取取1.96，表示信賴區間95%
偏倚區間=x￣(標準差)±(σx￣(標準誤差)X Z值（標準常態分佈Ｕ的某點的值)
σx￣=σ / √n X FPC，FPC≒1。
信賴區間95%=28.9±(2.4 /√4X 1.96)
平均有26.548~31.252會被涵蓋在95%信賴區間內。

·小樣本使用總偏差平方和及T分布敘述信賴區間
既然σx￣(標準誤差)有三種型式考量樣本大小與群(母)體的推估方法。
那如果評估時樣本抽樣太少，與群(母)體差異不大時，除了FPC修正係數。(Finite Population Correction)
樣本元素為可重復組合：FPC(H(N,n))→√(N+n/N+1)
樣本元素為不可重復組合：FPC(C(N,n))→√(N-n/N-1)
若兩者差距大，n/N≦1/10，則修正係數=(N-n/N-1)≒N/N≒1，σx￣=σ/√n X 1。
若兩者差距不大時：
是不是也可以評估常態分配的Z值去經過某種修正變異數(自由度)的大小差異，會比較符合實際的預測。
例如：一般Z值取取1.96，表示信賴區間95%使用，t分配：tφ(α冒險率)，會變成隨自由度Φ而變的值，去修正。
此時：標準差95%信賴區間就會敘述成：
偏倚區間=x￣(標準差)±(σe(不(無)偏變異數的開平方根)X tφ(α冒險率)
σe=√V =√ S(偏差平方和) / n-1。
S(偏差平方和)= Σ ((xi － x￣)^2) － {[Σ (xi － x￣)] ^2 } / n

例題：5樣本，130，110，200，165，130，平均為735/5=147。
S(偏差平方和)= Σ ((xi － x￣)^2) － {[Σ (xi － x￣)] ^2 } / n
S(偏差平方和)= ΣX^2 － (ΣX )^2 } / n

樣本值	xi － x￣	(xi － x￣) ^2
x	X	X ^2
130	-17	289
110	-37	1369
200	53	2809
165	18	324
130	-17	289
=SUM(Σ)	0	5080

S(偏差平方和)= ΣX^2 － (ΣX )^2 } / n
S(偏差平方和)= 5080 － ( 0 )^2 / n =5080

σe=√V =√ S(偏差平方和) / n-1
σe=√V =√ 5080 / 5-1=35.63706
tφ(α冒險率)=使用EXCEL的=T.INV.2T(0.05,4)求出= t4(0.05)=2.7764
以t分佈的某點區間推定：=x￣±( tφ(α)* σe / √n)
故信賴區間95%=x￣±( t4(0.05)* σe / √n)
故信賴區間95%=147±(2.7764 * 35.63706 / √5)
故信賴區間95%=102.8＜μ＜191.2。

使用 EXCEL T檢定參考：
'=T.DIST(2.7764,4,TRUE)=0.974998846
'=T.INV(0.025,4)=-2.776445105
'=T.INV.2T(0.05,4)=2.776445105
'=T.DIST.RT(2.7764,4)=0.025001154
'=T.DIST.2T(2.7764,4)=0.050002308

	A	B	C	D	E
1	樣本值	xi － x￣	(xi － x￣) ^2	'=AVEDEV (A3:A7)	'=AVEDEV (A3:A7)
2	x	X	X ^2	'=AVERAGE (A3:A7)	'=AVERAGE (A3:A7)
3	130	'=A3-$E$2	'=B3^2
4	110	'=A4-$E$2	'=B4^2
5	200	'=A5-$E$2	'=B5^2
6	165	'=A6-$E$2	'=B6^2
7	130	'=A7-$E$2	'=B7^2
8	SUM(Σ)=	'=SUM(B3: B7)	'=SUM(C3: C7)
9	S(偏差平方和)=	'=(C8-(((B8)^2))/ COUNTA( A3:A7))		'=COUNTA( A3:A7)	'=COUNTA( A3:A7)
10
11
12	σe標準誤差=	'=SQRT(B9 /(E9-1))
13
14	tφ=	'=T.INV.2T( 0.05,(E9-1))
15
16	故信賴區間95%	'=E2&"± ("&B14& "*("&B12& "/√"&E9&"))"
17
18	'=E2	'=B14*(B12 /SQRT(E9))
19	故信賴區間95%	'=A18-B18& "＜μ＜ "&A18+B18

由一組展開成多批組平均值

承上篇一組
以t分佈的某點區間推定：=x￣±( tφ(α)* σe / √n)

多組
自由度為各自由度之和：φt=φa+φb+...+φn
樣本：nt=na+nb+…+nn
樣本平均：xa￣+xb￣+...+xn￣
偏差平方和：Sa+Sb+...+Sn
不(無)偏變異數平方根σet=√Sa+Sb+...+Sn / (na-1)+(nb-1)+…+(nn-1)

若計算評估各組平均值差(其實無實際意義)，頂多計算兩組平均值到底差在多少。
以t分佈的某點區間推定：=xa￣　－　xb￣然後去計算± tφt(α)* σet / √nt)

不忘初心，不盲目把過程當作成就，反省思考最初的，最重要的是什麼？是找到變因，是改善證真跡象。

而不是逐漸失去初心，只為計算推估證真機率，而忘記機率始終只是事物的估計證真跡象，就算樣本足夠大也不如直接跳出這追求差幾個小數點的迷途。

你會發現總有不在你預測機率之內的例外情況發生，不如去實際跟人溝通看看，人溝通好了，也就改善了最大影響的變因了。

審查變異數的初心的是審查客觀的事物，不要到後來變成自己去用自我的知識優越性去影響他人的心態，以顯示自己自以為是的，用所知的知識去彰顯自己在精神上的優於他人的優越性。

人類在這地球上更遑論是在宇宙中，實實在在的很渺小，不要日夜孜孜不倦的去處理這追求差幾個小數點的研究，只為了證明自己自我本身比別人聰明，走偏了道途。

從初始的審查客觀事物的愛智之人，為了改善實際變因所造成製程的不良影響的實務之人，變成只是單純自我證明自己贏過別人，勝過別人的，這樣的錯誤的只為證明自己優於他人的優越性的迷途。

判斷兩者是否有顯著不同使用EXCEL T.TEST 函數

假設變異數相同，獨立雙樣本t檢定
=T.TEST(A19:A28,B19:B28,2,2)
假設變異數不同，獨立雙樣本t檢定
=T.TEST(A19:A28,B19:B28,2,3)

通常會以0.05作為p(冒險值)，假如小於0.05代表兩個平均數有顯著的不同，大於0.05表示沒有明顯的不同。

如果兩群樣本都來自於常態分配，而且樣本之間是有配對關係的，這時候就要使用成對雙樣本 t 檢定。
成對雙樣本t檢定
=T.TEST(A32:A41,B32:B41,2,1)

銘記星辰之下

信賴區間推定-小樣本使用總偏差平方和及T分布敘述信賴區間-排列組合機率78

沒有留言:

張貼留言

人類探索宇宙越久，越明白一件事：地球不是暫住之地，而是目前唯一的家園。