2022年12月21日 星期三

以近似常態分布機率函數,樣本:n,x ̄,σx,由上限與下限的差距,產出全距R。-排列組合機率70

 

機率上承排列組合,下接製程管制。---還記得二項分布的機率,當擲一骰子(一實驗) X 一次(N=1)時,有0.5%機率是正面(通過,證真,go),有0.5%機率是正反面(不通過,證假,NOgo),逐漸擲多次N→∞,所得到的分布機率函數,兩邊±一起看曲線分布,因為看起來很像鐘型,又叫做鐘型分布曲線,又因大量在現實(實際)上好像有某種關聯都隱隱約約很接近它,又叫常態分布機率。

---接著,因為是多個原因造成的某種機率分布,既然是機率總有不確定性,且大數(大量數據)下的偏倚誤差又搞不清楚為什麼?---例如說:平均值μ=1/N (數組項數)X (x1+…+xN)(數組總和) ,變數與平均值的偏倚偏差: x - μ (數組內某數與數組平均差距)。


從一千二百年來,不斷的修訂,增加許許多多的分布評估,解釋,估計,,調整,修訂等等係數。名稱很繁瑣複雜,但其內全是來自數學分解推導這些 機率 到底在做什麼?

舉例來說:前五篇討論到:變異數σ^2=(x - μ)^2 / n^2,標準差σ= √( x - μ)^2  / n,平均值的標準差σx ̄=σ^2x=σ^2 / n→σ/√n=σx ̄X FPC修正係數。---FPC修正係數。(Finite Population Correction),樣本元素為可重復組合:FPC(H(N,n))→√(N+n/N+1),樣本元素為不可重復組合:FPC(C(N,n))→√(N-n/N-1)。若兩者差距大,n/N≦1/10,則修正係數=(N-n/N-1)≒N/N≒1,σx ̄=σ/√n X 1。,可是我們之後看到的都是樣本與群體都是用當N大於n時,估計數遠大於樣本抽樣時,想當然爾(估計,內心小劇場預測)就會是≒N/N≒1,要不然就是(N-n/N-1)=n/N≦???某個數。


到了現實製程管制部份:

觀察機率分布曲線上Y軸各點在X軸上的情況:記住群體平[均值σ=樣品平均值x ̄為:機率曲線中央CL點。

群體:N, μ,σ以常態分布機率函數,由-∞到x ̄到+∞共±3個Z值,Z值6個水準,以近似常態分布機率函數,樣本:n,x ̄,σx,由上限與下限的差距,產出全距R。由製程規格之(x ̄)CLx ̄,後得出UCLx ̄(規格上限)與LCLx ̄(規格下限),後推導成為Ca,Cp,Cpk。

UCLx ̄=x ̄+3個Z值(σx),這個(σx)的評估:

(σx)是觀察機率分布曲線上的-∞~X~+∞∫F(χ; μ, σ) = [ 1 / (σ (2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}之常態分布,數學期望值或期望值u等於位置母數,決定了分布的位置;其變異數σ^2的^(1/2)開平方等於標準差σ等於尺度母數,決定了分布的幅度。而後Z值則是:Ф(u) = [ 1 / (σ(2 π)^1/2) ] exp{ -1[(  u  )^2] / 2σ^2}。u=χ-μ/σ,μ=0,σ=1,u=χ-0/1,u=χ。X→-∞∫X+∞ Ф(u) d(u)。

Excel 中使用=NORM.S.DIST(Z ,1)(Z值表),這個函數關注的則是: §  常態密度函數的方程式 (cumulative = FALSE) 為:F(χ; μ, σ) = [ 1 / (σ (2 π)^1/2) ] exp{ -1[(χ-μ)^2] / 2σ^2}=常態分布期間的機率質量函數(C=0)恰好等於x。

§  當 cumulative = TRUE 時,公式即為從無限大的負數到給定公式 x 的整數。 x=-∞ 到 x 的累積函數面積。
UCLx ̄=x ̄+3個Z值(σx)
LCLx ̄=x ̄-3個Z值(σx)
R=√(UCLx ̄^2)+√(LCLx ̄^2)=x ̄±3個Z值(σx)


每一批Z(ε%)是由=  x ̄  -  μ  /    σ x ̄  ,再用Excel =NORM.S.DIST(Z,1)計算-∞→x ̄ 的Z(ε%)。
當符合足夠抽樣比時,這樣就可以使用標準常態分布方式來計算95%偏倚信賴區間:即Z{0.025}=1.96,即兩邊Z=0.05(5%),1-0.05=0.95=95%。
95%偏倚區間=x ̄(標準差)±(σx ̄(標準誤差X 1.96值)


參考此網址https://www.zhihu.com/question/31433710,可以計算n在大於4個時,推算出各個係數的值,因舊時不可能一直重算,重推導數學式,所以能簡易將常用情況造成的評估值製成表格資料,以利使用。

若N(μ,σ^2),則  x ̄=(1/n) X  nΣi=1 xi時,則μ=σx ̄=E(x ̄)
=x ̄的x ̄期望值(標準差)=CL。在UCL和LCL,以σ/√n=E(R)/UCL和LCL的d2,則μ+3σ/√n這樣的距離,會近似於UCL= E(x ̄)+3σ/√n=E(x ̄)+3 (1/√n)d2(R ̄)=x ̄的x ̄+A2(R ̄),這就是A2的由來。

同樣的方式在以全距,令W=R/σ,σw=d3,σR=σwσ=d3 (R ̄)/d2,這樣其上限UCL=μR。會近似UCL= (R ̄)+3 (d3/d2)R ̄=(1+(3 (d3/d2)))R ̄=D4R ̄,其下限LCL=(1-(3 (d3/d2)))R ̄=D3R ̄,這就是D3,D4的由來


沒有留言:

張貼留言