2022年12月29日 星期四

信賴區間推定-小樣本使用總偏差平方和及T分布敘述信賴區間-排列組合機率78

 當符合足夠抽樣比時,這樣就可以使用標準常態分布方式來計算偏倚信賴區間:即Z{0.025}=1.96,

偏倚區間=x ̄(標準差)±(σx ̄(標準誤差)X Z值(標準常態分佈U的某點的值))
使用EXCEL=NORM.S.DIST(Z,1)


Z

=NORM.S.DIST(Z,1)

2ε以α
表示稱為
冒險率

1-α=
可靠度
(信賴區間)

1.96

0.975

0.050

95.0%

2.58

0.995

0.010

99.0%

1

0.841

0.317

68.3%

2

0.977

0.046

95.4%

3

0.999

0.003

99.7%

0.68

0.752

0.497

50.3%

1.65

0.951

0.099

90.1%

0.85

0.802

0.395

60.5%

1.04

0.851

0.298

70.2%

1.15

0.875

0.250

75.0%

1.29

0.901

0.197

80.3%

1.44

0.925

0.150

85.0%


達常態分佈時:

Z值取取1.96,表示信賴區間95%
Z值取取2.58,表示信賴區間99%
Z值取取1,表示信賴區間68.3%(±1標準差常用)
Z值取取2,表示信賴區間95.4%(±2標準差常用)
Z值取取3,表示信賴區間99.7%(±3標準差常用)
Z值取取0.68,表示信賴區間50%(有5成機率涵蓋)
Z值取取0.85,表示信賴區間60%(有6成機率涵蓋)
Z值取取1.04,表示信賴區間70%(有7成機率涵蓋)
Z值取取1.15,表示信賴區間75%(有7成半機率涵蓋)
Z值取取1.29,表示信賴區間80%(有8成機率涵蓋)
Z值取取1.44,表示信賴區間85%(有8成半機率涵蓋)
Z值取取1.65,表示信賴區間90%(有9成機率涵蓋)
Z值取取1.96,表示信賴區間95%(有9成半機率涵蓋)
Z值取取2.58,表示信賴區間99%(有9成9機率涵蓋)

請注意σx ̄(標準誤差)有三種型式考量樣本大小與群(母)體的推估方法。
偏倚區間=x ̄(標準差)±(σx ̄(標準誤差)X Z值(標準常態分佈U的某點的值)
以(μ,σ^2 / N)的常態分佈U的某點區間推定:x ̄-σx ̄ *Z  <μ< x ̄+σx ̄ *Z 。

簡例:某製造過程良率分布已能達常態分佈時,已知群(母)體標準差σ為2.4。其抽驗4個樣品,樣本平均x ̄=28.9,不考慮樣本與母體差距,以無限群體方式設FPC。
則:求標準差95%信賴區間為如何敘述:
Z值取取1.96,表示信賴區間95%
偏倚區間=x ̄(標準差)±(σx ̄(標準誤差)X Z值(標準常態分佈U的某點的值)
σx ̄=σ / √n X FPC,FPC≒1。
信賴區間95%=28.9±(2.4 /√4X 1.96)
平均有26.548~31.252會被涵蓋在95%信賴區間內。




·小樣本使用總偏差平方和及T分布敘述信賴區間
既然σx ̄(標準誤差)有三種型式考量樣本大小與群(母)體的推估方法。
那如果評估時樣本抽樣太少,與群(母)體差異不大時,除了FPC修正係數。(Finite Population Correction)
樣本元素為可重復組合:FPC(H(N,n))→√(N+n/N+1)
樣本元素為不可重復組合:FPC(C(N,n))→√(N-n/N-1)
若兩者差距大,n/N≦1/10,則修正係數=(N-n/N-1)≒N/N≒1,σx ̄=σ/√n X 1。
若兩者差距不大時:
是不是也可以評估常態分配的Z值去經過某種修正變異數(自由度)的大小差異,會比較符合實際的預測。
例如:一般Z值取取1.96,表示信賴區間95%使用,t分配:tφ(α冒險率),會變成隨自由度Φ而變的值,去修正。
此時:標準差95%信賴區間就會敘述成:
偏倚區間=x ̄(標準差)±(σe(不(無)偏變異數的開平方根)X tφ(α冒險率)
σe=√V =√ S(偏差平方和) / n-1。
S(偏差平方和)=  Σ ((xi - x ̄)^2)   - {[Σ (xi - x ̄)] ^2 }  / n 

例題:5樣本,130,110,200,165,130,平均為735/5=147。
S(偏差平方和)=  Σ ((xi - x ̄)^2)   - {[Σ (xi - x ̄)] ^2 }  / n 
S(偏差平方和)=  ΣX^2   - (ΣX )^2 }  / n 


樣本值

xi - x ̄

(xi - x ̄) ^2

x

X

X ^2

130

-17

289

110

-37

1369

200

53

2809

165

18

324

130

-17

289

=SUM(Σ)

0

5080



S(偏差平方和)=  ΣX^2   - (ΣX )^2 }  / n 
S(偏差平方和)=   5080   - ( 0 )^2  / n  =5080

σe=√V =√ S(偏差平方和) / n-1
σe=√V =√ 5080  / 5-1=35.63706
 tφ(α冒險率)=使用EXCEL的=T.INV.2T(0.05,4)求出= t4(0.05)=2.7764
以t分佈的某點區間推定:=x ̄±(  tφ(α)*  σe /  √n)
故信賴區間95%=x ̄±(  t4(0.05)*  σe /  √n)

故信賴區間95%=147±(2.7764 *  35.63706 /  √5)
故信賴區間95%=102.8<μ<191.2。


使用 EXCEL T檢定參考:
'=T.DIST(2.7764,4,TRUE)=0.974998846
'=T.INV(0.025,4)=-2.776445105
'=T.INV.2T(0.05,4)=2.776445105
'=T.DIST.RT(2.7764,4)=0.025001154
'=T.DIST.2T(2.7764,4)=0.050002308




 

A

B

C

D

E

1

樣本值

xi - x ̄

(xi - x ̄) ^2

'=AVEDEV
(A3:A7)

'=AVEDEV
(A3:A7)

2

x

X

X ^2

'=AVERAGE
(A3:A7)

'=AVERAGE
(A3:A7)

3

130

'=A3-$E$2

'=B3^2

 

 

4

110

'=A4-$E$2

'=B4^2

 

 

5

200

'=A5-$E$2

'=B5^2

 

 

6

165

'=A6-$E$2

'=B6^2

 

 

7

130

'=A7-$E$2

'=B7^2

 

 

8

SUM(Σ)=

'=SUM(B3:
B7)

'=SUM(C3:
C7)

 

 

9

S(偏差平方和)=

'=(C8-(((B8)^2))/
COUNTA(
A3:A7))

 

'=COUNTA(
A3:A7)

'=COUNTA(
A3:A7)

10

 

 

 

 

 

11

 

 

 

 

 

12

σe標準誤差=

'=SQRT(B9
/(E9-1))

 

 

 

13

 

 

 

 

 

14

 tφ=

'=T.INV.2T(
0.05,(E9-1))

 

 

 

15

 

 

 

 

 

16

故信賴區間95%

'=E2&"±
("&B14&
"*("&B12&
"/√"&E9&"))"

 

 

 

17

 

 

 

 

 

18

'=E2

'=B14*(B12
/SQRT(E9))

 

 

 

19

故信賴區間95%

'=A18-B18&
"
<μ<
"&A18+B18

 

 

 



由一組展開成多批組平均值

承上篇一組
以t分佈的某點區間推定:=x ̄±(  tφ(α)*  σe /  √n)

多組
自由度為各自由度之和:φt=φa+φb+...+φn
樣本:nt=na+nb+…+nn
樣本平均:xa ̄+xb ̄+...+xn ̄
偏差平方和:Sa+Sb+...+Sn
不(無)偏變異數平方根σet=√Sa+Sb+...+Sn / (na-1)+(nb-1)+…+(nn-1)

若計算評估各組平均值差(其實無實際意義),頂多計算兩組平均值到底差在多少。
以t分佈的某點區間推定:=xa ̄ - xb ̄然後去計算± tφt(α)*  σet /  √nt)



不忘初心,不盲目把過程當作成就,反省思考最初的,最重要的是什麼?是找到變因,是改善證真跡象。

而不是逐漸失去初心,只為計算推估證真機率,而忘記機率始終只是事物的估計證真跡象,就算樣本足夠大也不如直接跳出這追求差幾個小數點的迷途。

你會發現總有不在你預測機率之內的例外情況發生,不如去實際跟人溝通看看,人溝通好了,也就改善了最大影響的變因了。

審查變異數的初心的是審查客觀的事物,不要到後來變成自己去用自我的知識優越性去影響他人的心態,以顯示自己自以為是的,用所知的知識去彰顯自己在精神上的優於他人的優越性。

人類在這地球上更遑論是在宇宙中,實實在在的很渺小,不要日夜孜孜不倦的去處理這追求差幾個小數點的研究,只為了證明自己自我本身比別人聰明,走偏了道途。

從初始的審查客觀事物的愛智之人,為了改善實際變因所造成製程的不良影響的實務之人,變成只是單純自我證明自己贏過別人,勝過別人的,這樣的錯誤的只為證明自己優於他人的優越性的迷途。



判斷兩者是否有顯著不同使用EXCEL T.TEST 函數

假設變異數相同,獨立雙樣本t檢定
=T.TEST(A19:A28,B19:B28,2,2)
假設變異數不同,獨立雙樣本t檢定
=T.TEST(A19:A28,B19:B28,2,3)

通常會以0.05作為p(冒險值),假如小於0.05代表兩個平均數有顯著的不同,大於0.05表示沒有明顯的不同。

如果兩群樣本都來自於常態分配,而且樣本之間是有配對關係的,這時候就要使用成對雙樣本 t 檢定。
成對雙樣本t檢定
=T.TEST(A32:A41,B32:B41,2,1)

沒有留言:

張貼留言