單元目的
! G2 @: z# Z* g! D" ^將宇宙間的事物與現象數量化、模型化,其主要的目的在於藉著科學的方
2 b, \5 F! c8 V* O3 a法,從這些事物與現象中,尋找期規律性,進而分析與探討其特性。在品
; K' S. L9 L4 p8 k質管制中產品品質特性,就是一種機率分配(機率模型)。從管制圖上所
) @0 c+ e+ X! C+ Y" X; f顯示的現象,我們可以了解製程的狀況;或由抽樣檢驗的結果,我們可以
% S" Y, }# O4 P# v+ ]' s: P' O, I6 G# z判斷同批產品是否合格,主要都是依據統計學上的各種機率分配與統計量
/ p w" P: L Y' l/ ?1 a
有所了解。
- b) O. D& H8 ]) x: n1 C7 j單元大綱
0 w, c5 O! t2 i2 W& `3 G2 F在本單元所介紹的常用分配,包括:
2 [5 F C% s, j$ f; Z `: i" X0 f+ r
一、基本機率論
9 w, F: [, I! q; ~9 I% W
二、數據描述方法
: y4 c9 |# O4 |% r0 x' u+ v* }
三、機率分配(群體分配)
( T% f$ w$ L: f+ o; e) h6 I* t4 l1. 不連續機率分配(計數值分配)
6 V. e; [9 d9 B: b1 P
a. 超幾何分配(Hypergeometric Distribution)
5 k3 I! T7 }" i4 _b. 二項分配(Binomial Distribution)
: H0 k/ K) q6 e' b8 c" z' _
c. 卜瓦松分配(Poisson Distribution)
0 _( m# U" x w* |. }
2. 連續機率分配(計量值分配)
P# S) W3 B; y0 O$ a- [* u) L: @
a. 常態分配(Normal Distribution)
* S& I* a7 U# J, w* Z0 x( U; {
四、統計量分配(抽樣分配)
) J/ G2 U0 l- V1.統計量之抽樣分配
$ v# S# p& y% s) B* {) `4 la. 樣本平均數( )之抽樣分配
) r# Z$ s# f. l. I: S2 M2 y" Z
b. 樣本全距(R)之抽樣分配
! w% ^! Z. `0 p' C, Z7 r; \# J$ zc. 樣本標準差(S)之抽樣分配
+ J* S% ^3 z4 K; k
d. 樣本變異數( )之抽樣分配
; z' s* c7 I b+ V2.定義於常態分配之抽樣分配
% c, U% Q s/ H' R; W
a. 卡方分配( distribution)
: R- x- U: D! ~# E
b. t分配
1 u9 z' R! u9 k w3 A0 zc. F分配
/ Y; N7 v0 |3 V1 q0 d9 n- }4 ]基本機率論
1 Q. A/ ]. A; \, |+ {2 }5 a7 Q
此部份的目的在介紹用在品質改善的基本的統計觀念與技術,因為統計在此扮
) Y; c R5 v, b$ k' i% i) F演一個重要的角色,藉由清楚地瞭解其相關的原理,使大家可以更知道其不同
$ d: [3 d' \1 U: Q3 T ~
與未來結果的分析。
' U6 K# \& k' z/ v母體與樣本(population and sample)
5 U0 E" p+ [9 A1 f* x7 v
母體(population):一組包括所有項目的集合。
4 E0 y% f0 q W+ m8 D, Tex:假設我們的目的是要知道七月份買進A廠牌湯罐頭的平均重量,
+ c* c' U5 F) {! n
則此case中的母體是公司七月買進所有A牌的罐頭(可能有50000罐),
& u) ^ Q% V v2 B& w
因為我們關心的是A牌的罐頭,所以即使公司還有買進其它牌子的罐
/ N$ S) g' ^' D
頭,母體仍只限於A牌。
) o# {9 O0 ]6 u0 h/ u樣本(sample):母體的子集合。實際上,很多生產線上無法量測所有產品取得
! x. _! H4 C. X所需資料,因為處理如此多的資料非常耗時費工且不可行,利用部份母體中的
! r, U- \" k3 i- C
資料來代替在此時是一個可行的選擇。
9 _- z* M, m6 m3 w+ ]( S% z8 R+ {
ex:承接上個例子,七月份買進的罐頭有50000個,樣本可能是隨機選
A8 H n- A- ]取500個。
- R7 \: p9 V% Y
參數與統計量(parameter and statistic)
! \* D+ K1 F& ~0 h/ s4 q: |* q6 g
參數(parameter):可以用來描述母體的一個特徵值。
0 B- U3 Z: U6 w# M$ qex:以A牌的罐頭而言,平均值可說是50000罐罐頭的一個參數。
' v3 |- {/ ~# q4 M$ C$ a統計量(statistic):是樣本用來推論未知的母體參數的特徵值。
0 E; F' R0 ^9 i- |ex:500個隨機選取的罐頭平均重量可以來推論50000罐罐頭的平均
1 d: V- ^1 y- o3 {" ^9 O值。
5 s$ g9 ~2 }) J5 e4 ]0 ^0 S機率(probability)
/ b: ]& F m. y/ |% s4 _機率(probability):發生的可能性。機率函數介於0跟1之間,0表示沒有發生的
9 f q# o3 m: w; Q可能;1代表確定會發生。
8 m$ a; R4 P( [( y機率的相對頻率定義:如果樣本空間所有事件發生的可能性均相同,則事件A
8 K8 O, W9 X2 ~, n
的機率計算方法如下:
0 V4 P' u& c. q2 q! d3 L0 z3 e
P(A) =
& z: h* |) s6 }4 {% z1 |0 |
P(A):事件A的機率
# d4 x: {! M$ ?/ x c) S
:事件A發生的方法數目
% ~ ]+ q% g+ O# B$ g, I6 E& y8 GN:樣本空間的點數
1 N0 `* C f4 ~9 b
這個定義是機率的相對頻率,只有在樣本空間所有事件的歷史資料均具備的情
* G$ @6 f7 W3 o3 `
況才能使用。
$ Y0 R* U! ?3 i0 X. k$ M) ~ex:擲一個骰子出現點數為單數的機率
: A8 l. o' {* U& B1 K9 A6 M$ q3 G% b
假如事件A為擲一個骰子出現點數為單數,則
% B5 l0 T- z/ `7 ^' C: e ?, F& ^樣本空間S={1,2,3,4,5,6},事件A={1,3,5}
/ F" H4 S, m3 XP(A) = =
6 W' r3 z2 T# ^% Q單純事件與複合事件(simple event and compound event)
( x6 d" K( P( u* R" k; q
單純事件:無法再分解的事件
/ |2 E h2 ?3 g# B! @! I* {
複合事件:由2個以上的單純事件所組成的事件
9 Q! d- [9 a. Q! yex:檢驗從裝配線取得的2個電路版,檢查是否合格,試問何者是單純
3 X3 C- Y+ T+ g, D$ w! u事件?計算出至少有一個電路板合格的機率。
: h/ y0 d% S3 ]3 P) {$ }
sol:
" w2 U6 _% p# M1 X& R7 N
:第一個電路板合格的事件
, d! I- c( ^, \( p
:第二個電路板合格的事件
1 @( e) G5 T3 m" u! \3 l
:第一個電路板不合格的事件
& m( S& M( M2 P8 @
:第二個電路板不合格的事件
8 w3 T; M% S& M9 E$ ?6 Z6 Z樣本空間S由四個簡單事件所組成
; \3 n% W: i( S& i) L$ h7 ^
S = { , , , }
# K3 W8 m! i# A/ P$ b各事件可以描述如下:
; M5 J' I# k4 N% E" W/ s/ Y) ]={ , }:第一與第二個電路板均合格的事件
3 X$ V7 \0 G6 H6 u5 D- s
={ , }:第一個電路板合格但第二個不合格的事件
- l8 l. J' J: |( g' j9 Y5 B9 ?={ , }:第一個電路板不合格但第二個合格的事件
# _, O1 T* a$ z9 f8 u! @. Y={ , }:第一與第二個電路板均不合格的事件
% J% E" f6 ^! v
如果事件B代表至少有一個電路板是合格的則B ={ , , },假
1 ]9 ?; o' O$ A( C
設每個事件發生的機率皆相同,
0 |0 Q1 B: n6 R' e! V. _
( d0 H1 j- u* l9 \# ?7 J
9 a' V! [8 D# Q4 N8 \0 ^; ^/ e# ]6 H2 A: w' c) i9 Q0 x
加法律:P(A∪B) = P(A or B or both) = P(A) + P(B) -P(A∩B)
7 Z0 l6 a- ~# M" G* F% H* [+ z
乘法律:P(A∩B) = P(A and B) = P(A)P(B∣A) = P(B)P(A∣B)
6 X+ l9 v2 F. w2 @7 R3 d條件機率
! D P, V5 F5 ]' I$ W+ d7 qP(B∣A)表示給定事件A下,事件B發生的條件機率。如圖
) ^0 j2 w z R" c
) R( D. C3 G$ y# g% }獨立與互斥事件(independence and mutually exclusive event)
: w# A+ @1 j* K' b# S4 c4 i- ]獨立(independence):A與B的結果相互不會影響稱A與B獨立,所以假如A與B獨
! |& p; i" h! j5 o$ |4 o立則P(B∣A) = P(B)或者P(A∣B) = P(A),此時P(A∩B) = P(A)P(B)
7 {- e7 m- Q2 g( s$ s互斥(mutually exclusive):A與B假如不能同時發生稱A與B為互斥事件,所以P(A
* a4 D0 h5 s% n* D∩B) = 0,P(A∪B) = P(A) + P(B)。因為如果A與B互斥,則兩者不能同時發生,
3 h% P2 L1 K5 ~5 d4 Z
故A與B為相依事件。
; h; ~6 j" \7 Y, }( Z& G! g8 \2 Q! p* D
例題:某鋼鐵公司生產鋼板,根據過去的經驗,有5%的鋼板長度不符合規格要求,有3%的鋼
1 h. G4 z; y0 l; n板寬度不符合規格,假設長度與寬度的製程不相關,請問
G: d: {5 s! F Ba.生產符合長寬規格的鋼板的機率有多少?
8 e6 u2 J; e. V0 t$ P9 ?
b.鋼板的長或寬不符合規格的機率為何?
- _7 [8 g6 r) |# Vc.鋼板的長與寬皆不符合規格的機率為何?
- t+ b2 U0 ?- i+ U; dd.假設鋼板的長與寬的製程並非獨立的,如果長度不符合規格會使切削寬度時的夾具位置不
1 ~7 G+ Q6 F2 `. s
正確,使的寬度有可能不符合規格,從經驗得知長度不符合規格時,寬度不符合給格的比例
. ?$ b; n. i& |" D6 R# x是60%,請找出長寬同時都不合格的鋼板比例。
' b6 u$ W5 ~' g& ~- R
e.在(a)中A與B是否互斥?
/ k+ c/ y+ y* X* r/ T
f.請描述如果A與B事件為互斥的情況下的情形。
* ^ m1 x# D& s+ V, G: J' t5 Asol: 假設A表示長度符合規格的產出;B表示寬度符合規格的產出
8 u- S1 {4 K+ Ga. 由題意知道P( ) = 0.05與P( ) = 0.03
4 f& z1 K- i( I( I, U" h; c" x
P(A) = 1- P( ) = 1 - 0.05 = 0.95
1 K0 S8 N. L, XP(B) = 1- P( ) = 1 - 0.03 = 0.97
5 O* P4 }8 e9 \6 b- p; v: FP(產出的鋼板長寬均符合規格的機率) = P(A∩B) = P(A)P(B) = 0.95 * 0.97 = 0.9215
1 ?, a# z9 }9 w- C8 q1 D: Lb. 鋼板的長或寬有一個不符合規格的機率 = P( or or both),從加法律得知:
* @' A, d; F6 n1 {1 A
P( or or both) = P( )+P( )-P( ∩ )
; X$ B8 M9 m8 [& l* {=0.05+0.03-(0.05)(0.03)
; S; f7 I1 ?1 ]" v% ]+ a3 w=0.0785
; {* R4 I; w- k; E# j! O/ S
所以有7.85%的工件長寬之中有一個不符合規格要求。
5 z1 o1 D/ p7 I }9 O5 j& p$ q
c. 題意是要找出P( ∩ ),而P( ∩ )=(0.05)(0.03)=0.015
1 T1 B) _8 U, |/ }, |+ u& f所以有0.15%的工件會不符合長與寬的規格。
5 z; `2 D( q# k
d. P( ∩ )是此題的目的,而且由題意得知P( ∣ )=0.60從乘法律知道P( ∩
8 j, x1 y) H) f) A i
)= P( )P( ∣ )=(0.05)(0.6)=0.03
* W: g8 R; n# N* N
所以有3%的鋼板的長與寬都不合格。
; ?/ F; ?4 \4 ce. 從(a)中得知 P(A) =0.95﹑P(B) =0.97﹑P(A∩B) = 0.9215,如果A與B互斥則 P(A∩B)應該等
: P+ Q3 I e7 C7 [
於0,但是實際上並非如此,所以A與B不是互斥事件。
& X6 m; D6 L5 p
f. 如果A與B事件為互斥則P(A∩B)=0,所以生產出的鋼板均不合格。
3 Y y$ q3 `! E0 m& J
8 F: a0 l" d( m# R7 h' f1 T
數據描述方法
' ]4 }; g+ ~$ j- \; B8 i' |& ^[ 中央趨勢量| 分散度]
1 Z6 _" R# x1 d8 M: R. E3 w& z& L7 t$ f; Z
統計是一種收集﹑分類﹑分析與從資料中做出推論的科學,一般可將統計分為
9 O$ J4 }) z) G$ l, [0 N) Q1 ~敘述統計與推論統計。敘述統計是從收集的資料中取得描述產品或製程特徵
/ @6 V9 D/ O. b$ w6 Z0 }+ z量。而推論統計是利用抽樣所得的資訊對未知的製程參數做出結論。
" ?$ @( M+ }$ [6 O+ [在此首先要介紹的是敘述統計,主要內容有:
( O, Q, K3 X7 I) f
1. 中央趨勢量的量測
2 v3 x0 V! L/ h- n2. 分散度的量測
5 }1 Q) d- D# M& P {6 e5 P' e
中央趨勢量的量測
% |7 R% y9 @) S: Y/ E在SPC中,中央趨勢量的目的是指出資料所處的位置與集中的值,可以幫助我們
& n' Q1 g+ F @% w. L$ i& b決定是否要更改製程的設定。包括下列數個具代表性的值:平均數﹑中數﹑眾
( V/ J, q1 t! _* x$ C
數與截尾平均數。
7 w, ~& R; E3 h+ R
a. 平均數(mean):
: B+ ?' Y/ _+ N0 n1 P
平均數在SPC中最常用來決定製程是否偏離目標值,樣本平均值以 表示,
" D7 u2 \' o& l1 J4 `4 u= 。母體平均數以 表示, = 。
" E6 F2 U6 @. Z4 I6 a6 [
例題a
: i2 Z6 P' A/ d8 s! s7 v9 |) Y
3 z! N0 w/ u* `5 p! C0 |b. 中位數(median):位於所有數值的中央稱為中位數,如果數值有偶數個,則取中間兩
& A& b) _6 I$ o/ l# T$ R個數的平均值當中位數。中位數的意義在於有50%的值小於或等於中位數。
2 @8 _* w4 e, N% s1 y
因為中位數比起平均數而言,較不會被極端值影響,故中位數比較穩健。
- r2 o* w% d, Q
( w1 r) P' N/ q# gc. 眾數(mode):出現次數最多的數稱為眾數
$ E* E C' w& \
截尾平均數(trimmed mean):截尾平均是取介於第一與第三四分位數中所有值的平均,
7 y0 H5 N6 ^8 H) U7 E比起平均數,截尾平均數較不受特別大或特別小的值所影響。同時又不是只代表某個
. \: F% X! r, I5 L; y7 F+ Q- Y- ^( S
出現頻率最高的值。
) B% k( w& c8 M: v+ ~: d3 |, w# D% \6 @* w+ P, C& B
分散度的量測
# L. y, R6 T! M8 Q9 R
分散度的量測提供資料變化分散的程度是SPC的基礎之一
- g4 {' `1 C5 h* U8 m2 G0 \
1.Range:在一組資料中最大與最小的差
) r- M4 v' s8 V! b i$ j# AR= Xc - Xs
: H- ^! g' x! Y/ _
↑ ↑
5 t0 K& {+ g( W7 {& O4 x最大 最小
6 C2 _6 p$ C k4 L8 U- }2.Variance 變異數:是測量觀測值均值變動的情形
2 p% W9 A# Q1 U; d% ~' G. u
3.標準差
! z3 U3 j$ M. O! u: o
4 }) C& \, G3 N- o+ I7 R7 REX_a:隨機測量銀行顧客等待服務的時間分別為3, 2, 4, 1, 2分鐘。
2 l6 {2 b+ D4 F1 E樣本平均或平均等待時間: = 分鐘
$ @7 u& a0 }5 F( ~* q5 I9 n2 h
N# G5 W) ~$ }5 v( j
EX_b:隨機抽取十個活塞的直徑(公釐)分別如下:52.3, 51.9, 52.6, 52.4, 52.4, 52.1, 52.3, 52.0, 52.5,
+ c9 b* ]/ E, F, c52.5,請問中位數為多少?
0 E* B, G2 N' j! ?4 rsol:將測量值排序後如下: 51.9, 52.0, 52.1, 52.3, 52.3, 52.4, 52.4, 52.5, 52.5, 所以中央兩個值分別為5
2 a8 i+ @/ B, h) D+ w3 R2 \& }與52.4,兩個值的平均數是(52.3+52.4)/2=52.35
2 ?+ b1 x! T# c4 }$ ` q
4 }& N. c) p$ l: k1 ~7 j8 K4 ]6 l/ d
8 W( [& ^# O/ l
EX_c:某個建材行要決定該儲存何種尺寸的圓形鋸以因應顧客隨時的需求,隨機從歷史銷售資料
3 t& f5 [$ Z1 O: {$ T9 @) C取30個樣本如下:
/ F+ `6 S+ l' N9 i' t7 H; R% Y- `由下圖可知眾數是120,所以直徑120的圓形鋸優先考慮要儲存。
5 N# _/ Z; \% g5 c" q
80 120 100 100 150 120 80 150 120 8
& s: E& f- g( h. S$ E5 O/ E0 O120 100 120 150 80 120 100 120 80 1
; O1 s7 C8 r5 D3 u* B# E. i100 120 120 150 120 100 120 120 100
6 R6 j( a% ?" _4 b; o+ W! y* Z
- @5 A; `8 Y0 J7 I/ H機率分配
, X" P1 ]/ Q B
[超幾何分配 | 二項分配 |卜瓦松分配 |常態分配 | 常用分配間之關係]
7 O) p* }% }" q2 V' `# Q0 }6 I8 T( D a3 h$ f1 K( e
機率分配(Probability Distribution)
7 F8 W% X% R( i
機率分配是一個數學模式,用以描述一個隨機變數(X)所有可能值出現之機率。機率分配
+ `9 p& O) ^$ q( h0 g7 h
可分為連續和不連續兩種。
8 ]! ]1 t$ }4 E, C
a. 連續分配
7 K- ~& D5 H7 D, O" k) n
若一變數使以連續尺度來量測,則其機分配為連續。如產品之長寬高尺寸。隨機變數
. J" ~6 {+ y# a; m
X落在a、b兩數值所界定之區域的機率為
# D$ C7 u8 R. E0 z3 U6 H( f
b. 不連續分配
. W( k% |: x4 f |% B+ Q6 q R
若變數只能為某些特定值,則稱其機率分配為不連續或離散。如顧客數目。隨
1 s4 C4 c$ o& ^$ v) }1 y* y機變數X等於某特定值 之機率為
4 r6 x2 `' d* }8 MP{X= }=p( )
q' c% q4 X$ D3 }9 k) h# U# [$ f
0 h) W$ Z& T* O9 ?; M! z
( V. i/ ?. e7 e6 Q; `
' D! R3 K% T9 U$ }2 l& D% [
超幾何分配
5 D" |, p$ g7 }+ `# a: Q( x4 C# [
從有限群體中,隨機抽取樣本而不放回時,需要採用超幾何(Hypergeometric)機率分配。
; T7 f; Z# d! I* N( V$ o1. 定義
1 W d( V( W# s# p- x8 V F如果一批產品共有N件,其中r件不良,其餘N-r件為良品,現自該批產品中隨
" h1 w5 W" C5 g; ]9 M* Y
機抽取n(n≦N)件產品,則其中有x件不良品之機率為
. f' k9 f! J! Z$ C' F, ^& ]
$ L+ j5 j N6 t9 V: S! N v4 u: J e
. O- B5 b# U5 S" T- g2 N
% ]7 l( N" Y- Q% a7 K |若不連續隨機變數x具有上式之機率分配時,稱為超幾何分配(Hypergeometric
* }0 l8 F9 Z4 L4 uDistribution)
8 B% ?; A% g2 X, u, J, {' E4 [& Z( X z. C7 t0 F0 S8 Q K6 c6 |
; y5 D3 A9 X- L8 @4 [! _/ Z. P; j1 _7 K3 ^% a
二項分配
7 M: p7 D" c8 i: B& N& |1. 定義:假設X為不連續隨機變數,若其機率分配為
- i4 G- d" w, [# I4 M, s,x = 0,1,2,…,n ,0<p<1
% Y3 F2 t- ~. F1 g; V! O5 cf(x)=0, x=其他數
3 Q, q4 k$ S4 I, K+ J2 [則稱X具有二項分配(Binomial Distribution)一個隨機試驗,其結果可分為兩個互斥事件A和B(如成功與失敗、正面與反面
2 x/ z- B/ a2 _* G
等),若發生A事件之機率為p,而發生事件B之機率為1-p,將該隨機試驗重複
, r7 j+ v5 L9 u# w6 U
試行n次,其中事件A出現x次,則此隨機變數X餒具有二項分配,其計算方式如
4 h& D4 H) G+ \2 q$ i6 e4 k0 j$ M
下:
& O% ?* f" w5 W l假設在n次實驗中,最初x次全出現A事件,其餘(1-p)次全為B事件,如上圖,
% n& p7 `+ ^! [% {* |
此情況之機率為 然而此種組合共有 次,所以其機率為
1 Y. T! R2 ~: E0 O
。
$ [: h5 |) G. `9 N超幾何分配用於群體之批量有限個數,而且其取樣的方法是取出不放回。下列
5 I3 l2 y- A# {三種情形應該採用二項分配:
6 u v' C8 T. G6 q2 p; J& m0 Q1. 群體批量為無限多。
g i D! ?) ?+ n) z
2. 群體之批量為有限數,但取樣方法為取出放回。
7 r/ p) J& b5 t) w5 t7 U& g, Y8 x
3. 群體之批量為有限數,因相當多,點算不便,且N>10n。
+ x4 Y9 Q7 h+ K, F/ t" B, s9 L( J2. 二項式的展開
- f7 z+ k h x [( T7 s- S
, L8 y0 {: k$ r3 X" Z
2 u. }- ^3 R1 s* G+ J
7 h+ u1 p3 j. l
p:A事件發生的機率(例如,一個不良率)
, g* ^3 v# q5 Zq=1-p:B事件發生的機率
1 M4 e" j6 d9 f. J& O6 O/ N7 }! T# `
n:試驗次數或樣本大小
y6 k8 C& r. NA與B為互斥事件
4 E. x2 i, x$ K# s
3. 二項分配之平均數與變異數
+ Y1 Q; ^) C( b+ s平均數: =E(X)=np
9 z' c6 J" i$ h) B
變異數: =V(X)=np(1-q)=npq
8 N& W0 G/ Q; t K9 `
p:群體不良率
$ Q% w1 R/ K2 N& a# p4 {q:1-p
" y! h0 o( i$ S7 v' G
" C+ Z# c u0 h7 r3 ]+ {0 Z1. 定義:如果x為不連續的隨機變數,具有機率分配
/ }0 a: \$ k, ]
6 i G' b/ p2 c7 X4 q5 I7 a0 Q2 o
: j' E; p, C p0 s5 z則稱X具有卜瓦松分配(Poisson Distribution)。
+ }! W' ~" p9 |& i) f$ b3 R卜瓦松適用在樣本n很大,且不良率很小的場合。一般而言,可歸納下面三種情
}( c: k1 T/ w0 t6 ~/ C0 G形:
# Y$ }4 g. {$ Z8 V- D( M% Xa. n ≧ 16
$ I- o5 x; [/ Y# P
b. p ≦ 0.1
7 S1 ]6 F5 Q/ D; c
c. N ≧ 10n
5 Z) k4 G" c$ r. H, R4 u應用卜瓦松分配的實例很多,常見的有:
$ E5 q+ g$ u5 T4 j: u( ^5 f; Z i
a. 單位時間內的觀察值。例如便利商店每小時的顧客人數、每天機器故障台數
: c7 A! O, E3 h6 N' L等。
. {: w! p) H, E; `b. 每一單位數量內的觀察值。例如每平方公分內缺點數、一批產品上的缺點數
7 m v+ Y; T4 ~$ r4 _( { {; p
等。
, h: C2 b+ B8 |: M2. 卜瓦松分配的平均數與變異數
5 y+ c. T8 s3 d! V9 m
平均數:μ=E(X)=C
5 M* w7 q1 R) s" e- [
變異數: =V(X)=C
& J! i+ q1 z) n9 W" Q( n卜瓦松分配的平均數與變異數是計算缺點數管制圖之主要依據。若群體情況未
; X c! O$ F. D知,則以平均缺點數代替之。
3 T6 E0 _7 x( \, w! R, n. v5 x
* C+ g# g6 f# d9 g8 F, `常態分配
* i" b8 R u6 p( ]7 b) [" g8 Q$ y
1. 定義:連續隨機變數X具有機率密度函數
8 C- g: f N0 l0 |% V( L
-∞<x<∞, σ>0, -∞<μ<∞μ
* ]) U9 m( j1 z: A0 \3 k則稱X具有常態分配(Normal Distribution),通常以N(μ, )表示。
- Q O2 R. G! t/ ~% H. h2. 常態分配之特性
+ e% o% m7 i% G. @# n, }0 a
a. 自然界絕大部分現象之分配均屬常態分配,如身高、體重、品質特性觀察
2 I( H% z! e3 Z值等
; N2 \3 F' j- A
b. 隨機變數x為連續變數,其定義域範圍介於。-∞與∞之間。
2 L( F- P5 g% L; V$ H6 H$ wc. 有兩個反曲點,在μ±σ處。
3 G6 d9 y4 C. Y$ v+ `. D
d. 為一單峰對稱分配,呈鐘型,以平均數為中心左右對稱。
! p. M- ?0 J8 @% q$ n9 e) e7 E, b
e. 常態分配的形狀決定於兩個母數,即平均數μ與標準σ。如圖下
' B8 v# d* O. ^! w& a0 Z
f. 曲線與X軸之間的面積總和等於1。
9 T1 t4 a5 x: x2 A/ s9 w
, S: s. Q) k: J: T% G2 I* j
^8 M& U7 E# L- l1 g( |4 V6 D: F: K# v7 ~- G4 P7 G
3. 標準常態分配
" }; R1 z' Q& g6 ^為使常態分配的計算簡化,可以經由下面這個公式將所有的常態分配轉換成標準常態
% T& @* e9 n* w- D& i c分配(μ=0,σ=1):
# N+ ~8 X! Q/ |0 ]) L, [! P經過轉換的標準常態分配機率值可以查表得知。。而其機率函數如下:
4 W# c0 X7 |! {5 y
, -∞<z<∞
) `" J0 o) U+ Y# H' a6 J" |由標準常態曲線,可以進一步求得±3之間的面積為0.9973,±2之間的面積為0.9544,±1
: W5 d* H: l2 }# ~1 q之間的機率為0.6828,如圖所示,其中μ=0,σ=1。
1 F' m( u; J# J5 s2 z( Y
: `5 r0 k1 m$ Q# k1 Z* v
/ h+ k2 g" ~/ f6 h
, }$ n8 w- Z, D6 l
4. 中央極限定理(Central Limit Theorem)
* E0 Z" P* D8 F5 H0 c中央極限定理應用於品質管制上,非常重要,因為從某一群體中,抽取n個樣本,其
& o9 _6 ~1 {: C' y a" Q1 h8 f$ o品質特性之觀測值分別為X1, X2, …, Xn,平均數與變異數分別為 與 ,則令Y﹦
/ ?5 W6 g7 D, L$ h* Z; ?' [
。
; L: k6 e4 r) `# c. M' G當n→∞時,f(Y)為常態分配。
2 v3 y4 |" g0 F6 o7 V, f/ |: d! {" y因為一般產品的品質特性值,很難得知屬於何種分配,但是,從中央極限定理得知,
! A8 v" O, g7 e2 z. d在未知群體分配時,只要抽樣的樣本n夠大,其平均數之隨機變數近似於常態分配,
2 l# U; i& w2 @) g
此定理提供了品質管制中的抽樣理論之學理根據。
$ S: K r0 N4 Z- H% g6 y( O4 n8 [( i
常用分配間之關係
! O7 G: L& y$ b$ ~: o
超幾何分配、二項分配、卜瓦松分配與常態分配之間關係可以用下表簡單說
! K9 Q n5 h# e( Q' u明:
& e: w/ p8 `+ x6 @( }+ U0 l
條 件 實 例 可用之近似值計算
' d5 B$ @* k: ~N>10n 批量為樣本數的10倍以上時 超幾何分配→二項分配
) t! e$ Y* a2 L) G# w4 I# B
p≦0.10
2 m9 ~8 L3 Q+ O* P- Knp>5
' w" Z9 P( J0 Q" x/ l& H不良率在10%以下,n很大,但
2 V" \: x1 m0 Z5 Z: \2 @
不良數不超過5個時
2 L& W" H& E( U+ W1 E4 t5 e
二項分配→卜瓦松分配
. e2 |2 v3 @- f7 g& B$ Cp<0.50
$ j: S4 R/ b* ?* [$ Z7 S" R: J
np>5
4 N2 N& r$ ?% { q& |不良率在50%以下,n很大,但
8 }; c, S' K1 b* M4 M% S# N不良數在5個以上時
" V9 Z8 v7 n1 f$ r6 W二項分配→常態分配
: N; P1 K( m4 v0 V3 s* O; \, qnp>10 樣本數很大,不良數有10個以
. [+ S' z6 m7 s$ {: t& Q: `上時
" l' b: p0 l2 D0 r" `4 ]9 ^卜瓦松分配→常態分配
/ U2 P& Q6 n0 w5 G6 m8 b3 n# g. U7 g& z6 f: i3 E7 @$ y' V
抽樣分配
9 x/ w! M+ r( f. |) M2 F% ~/ ~! X
[ 統計量之抽樣分配| 定義於常態分配下之抽樣分配 ]
& ]8 M, F# ^" k. k
& n9 l, }, E# i/ M6 N: A# I6 b* k5 Q' O
統計量之抽樣分配
i( _; G. L, s在研究宇宙間的現象時,由於人力或財力所限,無法對整個群體觀察研究,致使
7 J- P( J+ S5 a9 `
無法獲知群體所蘊藏的某種特性,但若能依據某種法則由群體中抽取樣本,即可
; X$ J9 H. z) P; l1 \; h7 w5 z
由樣本去推測群體之特性或相互關係。
1 f4 t$ p9 {1 ~6 o
w1 Q0 y/ ~& F5 H( C2 I( m
}0 C4 E/ |3 s" }
6 x r, H3 m2 m/ H* s* O8 @: H% ^1. 樣本平均數( )之抽樣分配
' c" [' p9 v% a0 n假設X為平均數E(X)= 及變異數V(X)= 之隨機變數, 為大小等於n之樣本平均
8 X& N4 K# |5 _數,則
& L1 j- v/ \% a( M a
' K% ~ [7 J$ F1 F" W
, p$ \8 W/ B) | |0 T {) r1 |! Y
. G3 V' l. ?$ k( J2 l3 |* z
7 K8 E) @4 ]1 x) ]
2 Z; L' a+ M/ d. c3 H( Q: K
∴不論群體為何種分配,若由群體中抽取大小為n之樣本,樣本平均數分配之平均數等
G) Q4 G' N, B8 d& Z q0 c7 O於群體的平均數,而樣本平均數之變異數等於群體變異數除以樣本大小之商。
2 [! x( _9 d2 H+ `7 ?, I
* \, X3 ~+ C; X
+ i2 t2 f! [/ r' d- g; o* U! Z' K$ K! z! s( C2 J; _' H
例16:X是常態分配N(30,9),假如從X中隨機抽取大小為5之樣本,使樣本平均數
8 e1 x; G" ]) G. f& @; J
構成一抽樣分配,則其平均數與變異數分別為多少?
6 e5 o l' ^# o) b
Sol:E( )= =30
8 m' Q. q' A3 b' g/ mV( )= =1.8
/ w3 S8 P1 U+ z# m
6 |, |' n7 Y% _; P( R" ?* D. W% o/ g
- C% G$ ^- _1 k8 {) Y4 E$ |' b& ^6 w! |
2 g: @4 h7 ]8 V9 ]' e9 W, D2 B) v' c+ U+ Z
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
4 |* i7 q" y8 J: j+ [
; E$ ~' K+ n G5 z3. 樣本標準差(S)之抽樣分配
, R& t4 K- X' i! o
7 f' R0 `$ E, C( \$ i# N6 h6 M
! _) n( }2 V+ t# Y" x5 u1 v& E7 f: Q7 j+ b9 F% H. g
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
( }" w5 _ r2 C$ n1 ^
) P E; x; D/ I. g4. 樣本變異數( )之抽樣分配
5 j& r' d3 U, I ]5 N6 A9 GM M
; m u z& ?+ m+ b' x+ xk X1, X2,……,Xn Rk
, q- x. K0 W# \5 ^ 組號 數 據 樣本標準
$ ?/ U* S( k) ?8 O8 I7 \+ ~5 a差
3 Z) b5 |2 r+ n+ ?
1 X1, X2,……,Xn S1
: }; m- _: n5 G4 ^1 h
2 X1, X2,……,Xn S2
6 I" o6 w( x8 J' k$ f/ N5 G& LM M
9 j; J! h: g- b+ m. U) h4 a" [
M M
& f, W1 l8 t/ V1 \: ]
k X1, X2,……,Xn Sk
9 G0 ~8 C( c) V) d3 N' M6 m. u+ _
2 A8 L% d) P$ M. Q/ c9 J2 ?' P
E( S)=
. L) k6 M* m! N9 T5 X, {8 t4 Y各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配
7 k$ j: z' k4 `1 J不是一個常態分配。
/ a& _- L$ E$ w; u
7 C+ ] c" R: c0 Q9 l" D" q4 M2 b& O5 A1 j- W- Q
定義於常態分配之抽樣分配
$ g8 C! L+ Y' H; ]
假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
/ F" o- X/ u9 Z+ F8 Y
隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
/ V7 I7 m; e/ F) x限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
+ s a+ F0 ^3 C* W抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
4 }' y! p: w7 Y& F4 U括卡方分配( distribution)、t分配和F分配。
+ e7 i' v* Q" U2 l/ ]卡方分配
G. K5 |, {+ q* X% x
假設n個獨立之常態隨機變數 ,其平均數分別為 ,
( J* o$ v/ H& p5 Z- ~ 組號 數 據 樣本變異
1 Q$ T' Q2 e& z, {6 f數
4 |8 I5 R! n {$ e" S8 L9 B
- q' f( {* [5 ?3 M
9 N9 u2 H. z" }) \
" y1 q( a4 P! L1 n8 p5 a( e, n+ I: ` W% C& K; Q4 d
定義於常態分配之抽樣分配
8 V3 @2 K, P0 A5 G
假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
$ Q. l \) Z+ T$ ?5 S$ c# z隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
' w% N. K6 c+ x$ e限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
8 v3 L# }3 Q! c j+ ~7 g
抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
9 z) f3 U; a+ z# _2 u7 i4 Y括卡方分配( distribution)、t分配和F分配。
' p# I7 {) ]" k' k& {# A% a( N9 y
卡方分配
; i, d1 }2 b* K) o% i5 p5 [. q* l
假設n個獨立之常態隨機變數 ,其平均數分別為 ,
0 D, O" O' u, F 組號 數 據 樣本變異
2 `& b" W; A6 b+ o% E& c4 |
數
; {2 c7 l+ Z' g8 ^& i! q5 ~3 f+ h8 Y, M. C/ c0 S
1 X1, X2,……,Xn
+ G. Y# _# i! C- {7 S2 X1, X2,……,Xn
' o7 b/ B; O C4 X6 y7 R: ~M M
2 Q# F: \' \4 j8 m& pM M
* ]/ m- a$ f# a0 D5 m* c7 I
k X1, X2,……,Xn
6 ^- a) Z( o0 f/ w3 Y; R; H變異數為 。
/ v; }/ b4 ]% w% `& s" n# S
' u3 u5 |7 Z7 W( l" e7 G0 _
" I1 U+ S- k7 }/ `( ?