單元目的
$ w* X0 h( U2 t1 v8 g將宇宙間的事物與現象數量化、模型化,其主要的目的在於藉著科學的方
+ F7 y# i! F* _4 |: D8 A& b* ]法,從這些事物與現象中,尋找期規律性,進而分析與探討其特性。在品
/ R9 E- u* X" `$ J3 C q- i: t質管制中產品品質特性,就是一種機率分配(機率模型)。從管制圖上所
8 [ p2 s0 e$ O3 T; Q! ~& l
顯示的現象,我們可以了解製程的狀況;或由抽樣檢驗的結果,我們可以
$ x- {3 R5 q/ l8 H: D0 b" q. x
判斷同批產品是否合格,主要都是依據統計學上的各種機率分配與統計量
|; }, p: G6 N/ [- @
有所了解。
+ K% J" p0 {8 \# O1 B# D6 z
單元大綱
# w _2 {& L2 w在本單元所介紹的常用分配,包括:
$ N4 y5 o' l3 [% a P
一、基本機率論
% ?" T: h( R7 H4 [二、數據描述方法
3 x0 b, ~$ q4 `6 V/ D
三、機率分配(群體分配)
0 t8 |0 `$ M& B( P& C
1. 不連續機率分配(計數值分配)
2 k' d% i, }% R# A2 a
a. 超幾何分配(Hypergeometric Distribution)
# u, I" k! y/ Y0 Y) P- y. Pb. 二項分配(Binomial Distribution)
4 C! e7 K/ t/ E- {( T
c. 卜瓦松分配(Poisson Distribution)
) i7 S0 O2 S. }2 Q! g
2. 連續機率分配(計量值分配)
4 P( D; ] b% K* B# f. Ba. 常態分配(Normal Distribution)
2 ]$ l4 n5 o$ Q四、統計量分配(抽樣分配)
9 h8 ]4 t" {5 i7 J. Q; m1.統計量之抽樣分配
}4 g; n' s$ n+ A3 e& Ra. 樣本平均數( )之抽樣分配
# g( a5 ]! E& ]- J8 `/ X- \/ Y; fb. 樣本全距(R)之抽樣分配
+ }$ w9 X. S1 ]; Q
c. 樣本標準差(S)之抽樣分配
% {+ q- S; u/ H, t
d. 樣本變異數( )之抽樣分配
- n& V) @/ ~/ J r6 [
2.定義於常態分配之抽樣分配
x9 J1 c9 F+ E3 Z2 B
a. 卡方分配( distribution)
# ?, C( a4 F/ u- _) M) u& p* u) Y
b. t分配
4 G1 k* w9 f. }. |0 _* x
c. F分配
N; N0 }" \0 I7 p8 n: E基本機率論
0 v( y$ S6 x9 ]8 U* ?
此部份的目的在介紹用在品質改善的基本的統計觀念與技術,因為統計在此扮
0 H. R: R1 o9 h' N
演一個重要的角色,藉由清楚地瞭解其相關的原理,使大家可以更知道其不同
( V7 D. R1 k0 Z5 e& t與未來結果的分析。
9 P+ A. u5 P. B母體與樣本(population and sample)
( C2 S# K8 d1 i7 U2 a
母體(population):一組包括所有項目的集合。
6 B/ J: r; H4 P/ V$ R
ex:假設我們的目的是要知道七月份買進A廠牌湯罐頭的平均重量,
. z( P [0 d* t8 S2 `
則此case中的母體是公司七月買進所有A牌的罐頭(可能有50000罐),
0 b$ v5 Q, _5 [" L2 T9 }8 d5 g因為我們關心的是A牌的罐頭,所以即使公司還有買進其它牌子的罐
" s9 N3 j3 d) u: K
頭,母體仍只限於A牌。
8 u) e. u3 t2 ^# c9 a! w+ C
樣本(sample):母體的子集合。實際上,很多生產線上無法量測所有產品取得
* r) l4 e# L( U! E$ I4 F* F/ b
所需資料,因為處理如此多的資料非常耗時費工且不可行,利用部份母體中的
3 U: m0 w' w0 c3 d" C- ? c7 s
資料來代替在此時是一個可行的選擇。
2 M5 j$ E0 b8 F gex:承接上個例子,七月份買進的罐頭有50000個,樣本可能是隨機選
- p t- {7 d" O( X取500個。
/ J, r2 K( }0 C' i7 ~8 _( [4 l: q- O
參數與統計量(parameter and statistic)
! F1 V0 a7 F4 z; t
參數(parameter):可以用來描述母體的一個特徵值。
4 c( L T3 A3 K. i9 O
ex:以A牌的罐頭而言,平均值可說是50000罐罐頭的一個參數。
* W/ H9 ?5 `5 b( ~# p
統計量(statistic):是樣本用來推論未知的母體參數的特徵值。
& G+ _& e; O% E1 `) E! O
ex:500個隨機選取的罐頭平均重量可以來推論50000罐罐頭的平均
7 T) Y% p) A2 H( W7 ^值。
- k& @1 z0 {( x/ l, J4 Y
機率(probability)
3 A& l+ C6 ^0 }: D# K
機率(probability):發生的可能性。機率函數介於0跟1之間,0表示沒有發生的
( ]5 V. T$ R4 ]
可能;1代表確定會發生。
5 f3 I- v9 R ]; M( g1 a" F
機率的相對頻率定義:如果樣本空間所有事件發生的可能性均相同,則事件A
6 Y, N9 ^4 P& y$ D5 v
的機率計算方法如下:
$ ~. [. {) q3 E# K% c
P(A) =
5 G; x3 r4 x0 B& O( vP(A):事件A的機率
9 k/ d2 L2 K1 s& O% A :事件A發生的方法數目
+ N4 {% x0 R" F6 @4 E6 P YN:樣本空間的點數
# z8 }1 K. h# T5 Y6 A
這個定義是機率的相對頻率,只有在樣本空間所有事件的歷史資料均具備的情
& `9 c$ s5 \% V6 q& i$ ?5 v/ A況才能使用。
2 G' {1 S# r& u( ^- @
ex:擲一個骰子出現點數為單數的機率
' A1 l* U- K r
假如事件A為擲一個骰子出現點數為單數,則
) C: C6 {1 |4 x4 W5 ]; e n1 ^; c& z樣本空間S={1,2,3,4,5,6},事件A={1,3,5}
( i1 s6 a" K! E* Z- l$ nP(A) = =
! R: Y8 @& E V5 @6 c5 x7 R單純事件與複合事件(simple event and compound event)
$ ?, W0 i* B$ a單純事件:無法再分解的事件
6 N% F! ^9 L" j& g" P複合事件:由2個以上的單純事件所組成的事件
/ d. E! t! {* C) l5 d1 [1 ?ex:檢驗從裝配線取得的2個電路版,檢查是否合格,試問何者是單純
2 Z) M. E) U4 S0 i/ ?
事件?計算出至少有一個電路板合格的機率。
, t g: e. |' ]1 d( xsol:
3 P, H2 Z6 M# q. H- q. t6 B:第一個電路板合格的事件
( ^/ b* z/ l& x* S6 C( v6 |
:第二個電路板合格的事件
+ S- [+ v, e5 }! b:第一個電路板不合格的事件
5 X3 r4 @" Y3 Z4 k& ~; e
:第二個電路板不合格的事件
% N) m. _% j) e! n) S樣本空間S由四個簡單事件所組成
9 F! B/ g, [, w$ H
S = { , , , }
3 H* s! k+ z1 r; G2 }2 ]7 Y# e
各事件可以描述如下:
1 y4 A7 d+ O6 o+ v
={ , }:第一與第二個電路板均合格的事件
0 r: P% x) L& ?) x& R={ , }:第一個電路板合格但第二個不合格的事件
, {- W5 ^7 ~8 x( X: `1 w4 R4 t5 I7 r={ , }:第一個電路板不合格但第二個合格的事件
' A) j1 G% D! L3 s
={ , }:第一與第二個電路板均不合格的事件
6 |) l( _( a; K1 e, t2 V! O( E
如果事件B代表至少有一個電路板是合格的則B ={ , , },假
2 L: A" S# `4 x* F, Y& d8 _設每個事件發生的機率皆相同,
5 o) @( I- ]) p
' {+ S* h) j$ r, n
( F% r) w* W4 X) K5 |$ f& M+ I4 Y( }- S1 @
加法律:P(A∪B) = P(A or B or both) = P(A) + P(B) -P(A∩B)
% a! e/ F) ?" y( q4 z6 A# }乘法律:P(A∩B) = P(A and B) = P(A)P(B∣A) = P(B)P(A∣B)
' s3 I1 U3 U% B1 k
條件機率
: O! d3 n7 v( `+ n
P(B∣A)表示給定事件A下,事件B發生的條件機率。如圖
& H6 K9 Y* _9 I" P- N: n; e( V
7 T: l \9 F1 n+ ?2 ~
獨立與互斥事件(independence and mutually exclusive event)
8 M& F0 L; ]# ]2 m. i7 w. k$ e獨立(independence):A與B的結果相互不會影響稱A與B獨立,所以假如A與B獨
1 `$ M) [( f- k: b- V8 P
立則P(B∣A) = P(B)或者P(A∣B) = P(A),此時P(A∩B) = P(A)P(B)
! r9 N; @; ]" \! x d互斥(mutually exclusive):A與B假如不能同時發生稱A與B為互斥事件,所以P(A
8 U+ T" @& A% L4 T7 s∩B) = 0,P(A∪B) = P(A) + P(B)。因為如果A與B互斥,則兩者不能同時發生,
! |5 ?1 Z; W" |" e
故A與B為相依事件。
" [& @1 }: ^0 V& ~. T* P2 z1 v; m/ u# r/ _/ O0 c7 F
例題:某鋼鐵公司生產鋼板,根據過去的經驗,有5%的鋼板長度不符合規格要求,有3%的鋼
0 o( e" }5 H+ a% v, k+ s+ G板寬度不符合規格,假設長度與寬度的製程不相關,請問
$ }. l/ n/ L6 o9 G. M! H
a.生產符合長寬規格的鋼板的機率有多少?
& D W9 L( \# A0 Z7 K3 Q
b.鋼板的長或寬不符合規格的機率為何?
% b% s9 U! ^: t# X, J4 Ec.鋼板的長與寬皆不符合規格的機率為何?
+ ?' h F+ ?& w; n% f* t1 D: s4 Pd.假設鋼板的長與寬的製程並非獨立的,如果長度不符合規格會使切削寬度時的夾具位置不
* |7 ]6 [2 ^2 Z" _
正確,使的寬度有可能不符合規格,從經驗得知長度不符合規格時,寬度不符合給格的比例
: q# V3 k$ w" l& T) k* c
是60%,請找出長寬同時都不合格的鋼板比例。
) F+ }: ]/ e% Q% T
e.在(a)中A與B是否互斥?
E }0 U4 i& u7 q- p0 R
f.請描述如果A與B事件為互斥的情況下的情形。
, Q( R8 D+ E* b# n$ }2 ksol: 假設A表示長度符合規格的產出;B表示寬度符合規格的產出
- }' _& d9 H/ i: t; Ia. 由題意知道P( ) = 0.05與P( ) = 0.03
! D f5 e+ {- }5 J( R8 R6 RP(A) = 1- P( ) = 1 - 0.05 = 0.95
' B+ o: [/ ]$ \) f9 m- eP(B) = 1- P( ) = 1 - 0.03 = 0.97
8 s9 F9 }$ G8 Q# S" l' k
P(產出的鋼板長寬均符合規格的機率) = P(A∩B) = P(A)P(B) = 0.95 * 0.97 = 0.9215
6 h3 K( ~9 X3 V1 A! I3 Z" Ab. 鋼板的長或寬有一個不符合規格的機率 = P( or or both),從加法律得知:
$ U3 o" M F8 `$ S+ M2 l
P( or or both) = P( )+P( )-P( ∩ )
( t. ]0 L: [! e9 E2 X7 Y& G" P
=0.05+0.03-(0.05)(0.03)
2 i$ I2 l6 y9 E: s2 n' |" J& J=0.0785
5 l9 v! w0 f2 n( q# a- Q所以有7.85%的工件長寬之中有一個不符合規格要求。
% j% N, @4 S6 l2 Y& O& S& _c. 題意是要找出P( ∩ ),而P( ∩ )=(0.05)(0.03)=0.015
8 x. f, h0 M. c# H+ P所以有0.15%的工件會不符合長與寬的規格。
$ {4 R# U/ q2 J; ~0 O
d. P( ∩ )是此題的目的,而且由題意得知P( ∣ )=0.60從乘法律知道P( ∩
" M1 r) [ l- c* j$ N)= P( )P( ∣ )=(0.05)(0.6)=0.03
: I( c% ]' ~9 D所以有3%的鋼板的長與寬都不合格。
: W( o6 [* m7 o+ i! n T, U8 Pe. 從(a)中得知 P(A) =0.95﹑P(B) =0.97﹑P(A∩B) = 0.9215,如果A與B互斥則 P(A∩B)應該等
+ K1 o9 s) I, y& m' U& S- w, J
於0,但是實際上並非如此,所以A與B不是互斥事件。
& d! B+ h* A0 t$ F6 }. o: i
f. 如果A與B事件為互斥則P(A∩B)=0,所以生產出的鋼板均不合格。
1 Z8 ?0 z9 s: i+ V; s( {4 P4 q& H
9 g+ O3 \# Q% }3 A, T$ L! e
數據描述方法
! X' ~+ W& f5 \( B* `[ 中央趨勢量| 分散度]
$ G( c& x* {: }$ p% k, h3 E
8 D, g9 f' c. L) w+ [
統計是一種收集﹑分類﹑分析與從資料中做出推論的科學,一般可將統計分為
( Q- l! M. z6 Q. z) b6 C
敘述統計與推論統計。敘述統計是從收集的資料中取得描述產品或製程特徵
9 j |) W$ R" ?4 v4 p+ A量。而推論統計是利用抽樣所得的資訊對未知的製程參數做出結論。
+ n& W- k+ @. W1 P3 x) ~! q在此首先要介紹的是敘述統計,主要內容有:
5 H2 E* }: B0 g% ^# H( r1. 中央趨勢量的量測
7 \+ K; O3 Y% U, {" {
2. 分散度的量測
3 N: | @* @3 z8 H' C% t* _. q2 o中央趨勢量的量測
3 A$ M* U, k8 h) D: d
在SPC中,中央趨勢量的目的是指出資料所處的位置與集中的值,可以幫助我們
% ~: ?3 J5 `$ \) |* p
決定是否要更改製程的設定。包括下列數個具代表性的值:平均數﹑中數﹑眾
& w4 ]3 l- ]3 a9 \0 f$ ]; |9 L
數與截尾平均數。
/ C* I5 f- z$ ]a. 平均數(mean):
$ n# v" u$ d& m% `7 B- d
平均數在SPC中最常用來決定製程是否偏離目標值,樣本平均值以 表示,
9 @2 R3 V% B1 p1 C* S= 。母體平均數以 表示, = 。
% E D9 w/ `0 m% I. @7 F例題a
9 r: S0 J' _5 {, Z0 t9 h
. P. i$ @# q( G: W o$ vb. 中位數(median):位於所有數值的中央稱為中位數,如果數值有偶數個,則取中間兩
* [, Q: x5 G; T- m7 z# V* n, J個數的平均值當中位數。中位數的意義在於有50%的值小於或等於中位數。
8 H8 }) u7 X' r7 h4 c* _
因為中位數比起平均數而言,較不會被極端值影響,故中位數比較穩健。
/ _) E% g) n+ u. b7 N1 n$ ?
3 f* k# G2 ]1 b6 W' c! Y
c. 眾數(mode):出現次數最多的數稱為眾數
! C! }4 v: g d) ^截尾平均數(trimmed mean):截尾平均是取介於第一與第三四分位數中所有值的平均,
1 k' f6 H" J f) Q U8 Z: ~8 d9 m比起平均數,截尾平均數較不受特別大或特別小的值所影響。同時又不是只代表某個
6 @3 i- f0 v) Q9 h* C9 S7 i出現頻率最高的值。
5 b0 Y! C2 I; u- b# k
4 ?0 X6 W% G# z8 u0 N0 c
分散度的量測
! X9 d! i7 L& w; T7 Z
分散度的量測提供資料變化分散的程度是SPC的基礎之一
: g2 c9 f( q+ y" V6 ?4 U$ a1.Range:在一組資料中最大與最小的差
4 }9 r; e6 G/ TR= Xc - Xs
. c2 v) @/ k- q* Z6 j* u↑ ↑
$ X+ M- k7 r. I7 u! W8 L
最大 最小
4 c/ | X4 X- A# o) a. e2.Variance 變異數:是測量觀測值均值變動的情形
2 {; m( T3 O9 ?) E9 t
3.標準差
0 A4 D. `6 b3 r0 `
. S1 H) V# A4 [8 w) L. D1 l
EX_a:隨機測量銀行顧客等待服務的時間分別為3, 2, 4, 1, 2分鐘。
0 Y5 V* M) Z3 N7 b* B! J' r樣本平均或平均等待時間: = 分鐘
* [9 d$ d+ ~) b& X% e. I5 E- O! \
$ M- C4 U0 `7 y% J3 EEX_b:隨機抽取十個活塞的直徑(公釐)分別如下:52.3, 51.9, 52.6, 52.4, 52.4, 52.1, 52.3, 52.0, 52.5,
2 R$ P' G) m. c. I* k52.5,請問中位數為多少?
_( G/ F* ]5 W! B; s* u0 c
sol:將測量值排序後如下: 51.9, 52.0, 52.1, 52.3, 52.3, 52.4, 52.4, 52.5, 52.5, 所以中央兩個值分別為5
8 m3 Q$ @, o1 x與52.4,兩個值的平均數是(52.3+52.4)/2=52.35
: t9 W- H& }, u! W) d. ^( y
6 k) w- X' \" S9 O6 h& l* Y4 I, e
* s! u$ j* z- O$ A& W( _5 a9 B/ wEX_c:某個建材行要決定該儲存何種尺寸的圓形鋸以因應顧客隨時的需求,隨機從歷史銷售資料
( J9 B, n2 D0 H6 K取30個樣本如下:
* V4 V8 w& x1 I5 P, e/ Z! j由下圖可知眾數是120,所以直徑120的圓形鋸優先考慮要儲存。
( B5 A& s# `$ G9 { ~# p/ Y
80 120 100 100 150 120 80 150 120 8
2 R: d) ^( S2 Z% N* P120 100 120 150 80 120 100 120 80 1
6 A, t3 u& I5 p3 P/ v; n. Z100 120 120 150 120 100 120 120 100
) u8 A6 s" J& ]4 v" L7 k! V# Y5 {4 b. E7 I! h# ? ]
機率分配
0 t' a" U3 I2 T
[超幾何分配 | 二項分配 |卜瓦松分配 |常態分配 | 常用分配間之關係]
6 r4 |, |: }5 T2 P6 J& n
$ @+ @# e* a4 b' |$ ^2 |機率分配(Probability Distribution)
) k7 ~- N8 `. `6 P/ O機率分配是一個數學模式,用以描述一個隨機變數(X)所有可能值出現之機率。機率分配
' [' O. n6 K+ L5 R可分為連續和不連續兩種。
0 F& A& ]9 a- T$ h
a. 連續分配
$ v4 Y: R! T3 L$ H- z, m若一變數使以連續尺度來量測,則其機分配為連續。如產品之長寬高尺寸。隨機變數
4 q8 i- r. b F' |" ~( ~. j) X. I
X落在a、b兩數值所界定之區域的機率為
( W: U3 z' ]: ^+ }! ~& w; Yb. 不連續分配
5 Y' e' C6 h( m# T' d' {
若變數只能為某些特定值,則稱其機率分配為不連續或離散。如顧客數目。隨
1 y( X5 c2 S3 L& w機變數X等於某特定值 之機率為
7 h* A, @, s6 t3 P* W u! iP{X= }=p( )
/ {6 V6 ~5 F: U8 {3 E% f/ H5 d9 g" |
8 D( |, {- ^: @/ [7 }4 B2 e. X
: X8 v7 ]0 [4 t7 B超幾何分配
# d R; S4 L/ x- D3 {從有限群體中,隨機抽取樣本而不放回時,需要採用超幾何(Hypergeometric)機率分配。
) L3 L0 \! A2 |1 ~( s
1. 定義
# C! g# R$ f6 a2 R& D* }. W如果一批產品共有N件,其中r件不良,其餘N-r件為良品,現自該批產品中隨
( I8 i5 W ?- L$ |8 G8 I
機抽取n(n≦N)件產品,則其中有x件不良品之機率為
: S8 n0 @& T. {( D# U' `# E
6 M& X: h$ K. M1 D. r% j, ] m
1 ]* G5 i) r# Q. z ^- k3 b
! P% Y" B* a3 Z8 H若不連續隨機變數x具有上式之機率分配時,稱為超幾何分配(Hypergeometric
5 F7 B# P' Q6 h+ w! G* K, bDistribution)
6 j% Z, a$ y. `) H. p! D. i; `/ @' g0 o- V5 M
" N, J2 O& j9 X n
. E4 L& A# _6 b8 V5 v二項分配
, q5 A4 R, X) H1 x- S6 B
1. 定義:假設X為不連續隨機變數,若其機率分配為
/ N2 U$ `8 h5 [# e7 W, S,x = 0,1,2,…,n ,0<p<1
7 }$ f3 f! c4 C4 ]f(x)=0, x=其他數
: c1 v& N# Q8 _
則稱X具有二項分配(Binomial Distribution)一個隨機試驗,其結果可分為兩個互斥事件A和B(如成功與失敗、正面與反面
2 F% c" w, m; F+ k; V等),若發生A事件之機率為p,而發生事件B之機率為1-p,將該隨機試驗重複
1 {- H; K4 K) {( h試行n次,其中事件A出現x次,則此隨機變數X餒具有二項分配,其計算方式如
J7 |0 q i" P2 z$ `% X! s
下:
- O; i8 x" b7 U% o" O假設在n次實驗中,最初x次全出現A事件,其餘(1-p)次全為B事件,如上圖,
+ H, l6 ^& L! X- l& G, n1 `* X此情況之機率為 然而此種組合共有 次,所以其機率為
+ r+ H4 x* j8 U3 t) Y1 ~。
. p! S% d# K+ z" U
超幾何分配用於群體之批量有限個數,而且其取樣的方法是取出不放回。下列
( a* f S/ U- C* D/ i, W
三種情形應該採用二項分配:
/ [% v1 J# P4 ^9 H6 u7 Y1. 群體批量為無限多。
6 a& r2 @" o' b+ b6 A2. 群體之批量為有限數,但取樣方法為取出放回。
V0 r/ }5 N p4 J
3. 群體之批量為有限數,因相當多,點算不便,且N>10n。
6 Z$ B1 g( I, g2. 二項式的展開
0 c7 c- T4 _$ P) r
: R0 g/ F R f+ @9 W) |
8 B8 K, d) |3 v. l4 v+ o5 _
B6 }+ A3 R$ p" z6 I0 d. ?8 z
p:A事件發生的機率(例如,一個不良率)
# x- [: e3 ^& v* t" u Q9 ]
q=1-p:B事件發生的機率
6 ^ c. Q9 a+ g. o; y5 a+ o0 S3 Zn:試驗次數或樣本大小
0 F X8 q4 u/ q
A與B為互斥事件
4 q; i% n7 Q7 l$ T8 u3. 二項分配之平均數與變異數
- R$ X7 ]# g, A! v
平均數: =E(X)=np
; i" i" |+ v1 ~; I) d$ M& w- y* e變異數: =V(X)=np(1-q)=npq
; _ I' x! U) l4 Bp:群體不良率
3 L$ S9 J1 t+ N% xq:1-p
+ R. [* Q0 M6 t6 z6 \. _* U4 R7 P# [+ O
1. 定義:如果x為不連續的隨機變數,具有機率分配
' {- A, ^! N% x1 P l+ Q* I% N
; m% ]. ` U; a6 j1 ?6 e ^) O6 J4 y* m) k: a
則稱X具有卜瓦松分配(Poisson Distribution)。
" i+ w3 f. d S" _; o卜瓦松適用在樣本n很大,且不良率很小的場合。一般而言,可歸納下面三種情
* h* [ W8 T; ]* D5 J形:
5 ?) ]5 ?5 J, Y4 C
a. n ≧ 16
0 ^$ X( \ J/ A2 h* [' Xb. p ≦ 0.1
$ H1 v- m2 m, q- L/ Nc. N ≧ 10n
" j$ t+ p7 c+ O; f應用卜瓦松分配的實例很多,常見的有:
. C% A7 e$ V3 E: T# Ta. 單位時間內的觀察值。例如便利商店每小時的顧客人數、每天機器故障台數
& u6 x8 ?* \( V2 h/ I+ q* A! ~等。
9 S( [+ o1 \* u! ib. 每一單位數量內的觀察值。例如每平方公分內缺點數、一批產品上的缺點數
- ?# A! B% W' w5 [
等。
4 C ^3 {7 {5 Z* _5 t: W
2. 卜瓦松分配的平均數與變異數
9 \$ H0 }; ]8 M8 ?. a% X# B/ W平均數:μ=E(X)=C
; \8 d1 o. W) t# ^) n W7 i1 G; d變異數: =V(X)=C
$ U# e8 j/ v6 x- O4 F+ `: Z: W
卜瓦松分配的平均數與變異數是計算缺點數管制圖之主要依據。若群體情況未
4 |- Z8 x7 l6 ~: H2 [' `) c
知,則以平均缺點數代替之。
, u+ a3 j1 y) |9 l a A
e1 L+ F( ]$ O7 G5 g* q# b! B
常態分配
; f& d6 T i" G$ e+ X1. 定義:連續隨機變數X具有機率密度函數
' B5 W" y; M0 W, Q1 M9 f5 {
-∞<x<∞, σ>0, -∞<μ<∞μ
. X+ h* Z3 z9 s4 X" o u* I
則稱X具有常態分配(Normal Distribution),通常以N(μ, )表示。
: s$ {; o) j [+ v1 A, O' R; [: `
2. 常態分配之特性
3 I3 N2 x$ }/ \$ W1 s* p5 l
a. 自然界絕大部分現象之分配均屬常態分配,如身高、體重、品質特性觀察
! z- S6 J8 a+ Y2 t
值等
) A/ ?4 A3 n7 \; ]: U7 }b. 隨機變數x為連續變數,其定義域範圍介於。-∞與∞之間。
, D" N/ G2 v2 z1 q- }3 X$ Y Yc. 有兩個反曲點,在μ±σ處。
9 L& C5 J. I+ md. 為一單峰對稱分配,呈鐘型,以平均數為中心左右對稱。
1 g+ V, k9 n* D* |* V8 U( je. 常態分配的形狀決定於兩個母數,即平均數μ與標準σ。如圖下
4 D, \0 V N" A! u2 V0 z jf. 曲線與X軸之間的面積總和等於1。
4 h. R- f, R F/ V- q* l) Q- Z A5 ]" C; P5 c \4 M
3 E K7 o i0 u- Q4 T2 O, J( Q7 k9 C& r3 T V) C% [8 Y2 ?
3. 標準常態分配
; y( f) R8 s8 T4 d+ @8 G為使常態分配的計算簡化,可以經由下面這個公式將所有的常態分配轉換成標準常態
: X0 O( H6 F8 `6 k+ L. }分配(μ=0,σ=1):
9 s) l* E. X2 o經過轉換的標準常態分配機率值可以查表得知。。而其機率函數如下:
+ I! Z/ _/ S5 E5 p" h, -∞<z<∞
6 U2 N% l3 M( ^$ m! n由標準常態曲線,可以進一步求得±3之間的面積為0.9973,±2之間的面積為0.9544,±1
4 m# @& u( L) J7 ?1 k8 }- \之間的機率為0.6828,如圖所示,其中μ=0,σ=1。
3 G; r/ F. P8 K, L6 R) G+ D
' p( E7 J# C, C! l3 x* ]
# g/ B; g/ ^% H7 s# v) }6 q. E7 e, c& G; w7 k6 e1 `3 ~
4. 中央極限定理(Central Limit Theorem)
5 O8 H2 T: E( b+ ?% I" a2 b% x" T中央極限定理應用於品質管制上,非常重要,因為從某一群體中,抽取n個樣本,其
! o3 l/ l/ @: w1 K5 `品質特性之觀測值分別為X1, X2, …, Xn,平均數與變異數分別為 與 ,則令Y﹦
& M$ I- b5 n/ y' s+ K. L。
* I! \! y' i# t: O* D9 H. v7 E
當n→∞時,f(Y)為常態分配。
" R, K: G( b4 ^! i; X' @# C v
因為一般產品的品質特性值,很難得知屬於何種分配,但是,從中央極限定理得知,
0 V6 Q, b) o2 l; S3 _
在未知群體分配時,只要抽樣的樣本n夠大,其平均數之隨機變數近似於常態分配,
) E# r; T O) D( y. x/ L" H5 M6 M" H此定理提供了品質管制中的抽樣理論之學理根據。
/ @. U. [7 O5 m; _5 p* M" Q$ y, j8 F% A; O/ i& _* B
常用分配間之關係
- |# ^ ]5 d9 z超幾何分配、二項分配、卜瓦松分配與常態分配之間關係可以用下表簡單說
( y+ ^6 _; u+ ^& l8 H1 V+ ?* u明:
9 r5 H1 F' V8 b7 v' H1 W條 件 實 例 可用之近似值計算
, H5 p; j1 I$ F" |N>10n 批量為樣本數的10倍以上時 超幾何分配→二項分配
4 w4 d9 @& K* @4 D# U7 y1 n( G/ ~p≦0.10
0 a3 y! n) r* T& f9 W7 Nnp>5
& K$ }. A4 @9 E
不良率在10%以下,n很大,但
: |% J8 z1 i; U( p( x2 V
不良數不超過5個時
7 W# ^/ d( P6 F) Z& G9 y7 O
二項分配→卜瓦松分配
. Z$ _8 }# I9 m
p<0.50
/ T5 _1 \( ^1 wnp>5
( z" l2 D1 q. k. p |不良率在50%以下,n很大,但
5 O: E: \4 w3 w$ Z
不良數在5個以上時
8 L# K& a2 i( D i0 U! A
二項分配→常態分配
( g* x- F# s( M0 a- B
np>10 樣本數很大,不良數有10個以
0 F; K( y2 d8 }7 I上時
( ~0 h% p: ]4 Q4 J卜瓦松分配→常態分配
4 P2 L. J' D) q4 \
+ v! y4 V5 D7 K4 O A( P# G抽樣分配
) s) z8 e+ \- q3 N. U, x. \% {& D% l[ 統計量之抽樣分配| 定義於常態分配下之抽樣分配 ]
F9 F+ L2 N" M, p6 W& L
( w& f& w3 b4 o, o8 ]
統計量之抽樣分配
5 D! c6 T2 x2 j7 Z* d8 f$ d& ?/ n
在研究宇宙間的現象時,由於人力或財力所限,無法對整個群體觀察研究,致使
" R P7 r2 d5 C# _+ t. q; u
無法獲知群體所蘊藏的某種特性,但若能依據某種法則由群體中抽取樣本,即可
: U* E6 d, q9 R由樣本去推測群體之特性或相互關係。
1 |2 S' }+ E i5 J
: G% z) c' D; A6 d+ b
0 P1 b3 q* \8 _0 [+ o/ o- _+ v! _" T$ p
1. 樣本平均數( )之抽樣分配
% U) |8 L7 |( P1 g' G7 O
假設X為平均數E(X)= 及變異數V(X)= 之隨機變數, 為大小等於n之樣本平均
: n% h' y, t% C/ N7 ^/ l M
數,則
$ G2 J2 f1 {+ e( \: C6 P2 g7 N. B* u
# A! ]+ m) b$ Y3 h4 u! H3 ^# t
- C2 x! ^9 h1 S! f
' m$ W1 P; l d) l g- ] @, z9 m: _1 i, l/ q, f
∴不論群體為何種分配,若由群體中抽取大小為n之樣本,樣本平均數分配之平均數等
( R: i8 [8 w! A6 J於群體的平均數,而樣本平均數之變異數等於群體變異數除以樣本大小之商。
$ k; y* B3 F6 U: N4 Q' h8 ?
0 }7 z1 w' t) ]5 d# O) I' U
2 N; L% r9 N+ \2 d6 |4 z
( a+ H L+ N4 n, R" ]. r
例16:X是常態分配N(30,9),假如從X中隨機抽取大小為5之樣本,使樣本平均數
' o+ D$ a! s. G9 r+ F. o4 Y
構成一抽樣分配,則其平均數與變異數分別為多少?
/ @2 Z4 Q" A* o* ]5 N3 n5 [Sol:E( )= =30
. a; @ ]% [$ V$ {3 }4 MV( )= =1.8
: ~+ z& t( c ^: @
5 H G# O; C" z" y/ V6 W) H; c
9 N% L2 u8 ~: n. L* g2 c, U: s0 t! f. I1 s
$ A' D, }* L8 u
T' m' x; k$ j" A1 g% X5 p" ?
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
8 A- `7 |3 y/ t% h" N3 z# t! L! w* R( X7 ?4 L' N6 N
3. 樣本標準差(S)之抽樣分配
4 _$ n) @9 q: U
8 N: P- j# g B" u; t% H: p
0 e b: E( W) Q% t
" E! d. |# R) p* N5 \各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
+ H6 f% ?8 k) m- w5 B
: C. I% y. Z9 C- P5 m3 \% P+ l( B4. 樣本變異數( )之抽樣分配
" |) J6 v3 F2 gM M
! d* x" `3 b1 b& j2 ]
k X1, X2,……,Xn Rk
6 J3 d' D0 p F& u% B) a( W; L
組號 數 據 樣本標準
) z0 p' T- h* Q( P, e6 Q- r
差
7 C* F+ Y Q, Z: [" p) j( O1 X1, X2,……,Xn S1
/ w9 u: s/ | P2 X1, X2,……,Xn S2
, Z: x6 b# Q, bM M
' M9 j) Q. W6 x& _; d& d
M M
, T: L/ [& J; ~: x( I7 kk X1, X2,……,Xn Sk
# r; n' N- \1 l2 G0 I0 |6 F" c, Q
* ^8 y6 N! k. f+ SE( S)=
: O. \% d, q/ i4 F" O5 W各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配
7 K+ n" g. u* c8 Q不是一個常態分配。
; ], J; c* W7 Q. B1 c
& e, d3 Y B& L5 Z! P+ \1 p: y# U1 q4 }, |5 I3 ]
定義於常態分配之抽樣分配
2 Q$ U: W9 R% i! N* _假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
1 S" Y% C; M5 r) `+ ]( J
隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
" q; U5 t* i- n$ `9 ^# ~, Z6 J
限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
- t: ?2 G0 L- G9 K9 `
抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
' a W/ F$ K$ x) Y括卡方分配( distribution)、t分配和F分配。
1 w' \4 ?& U# V, I( u3 B+ F6 ?卡方分配
* R. p( w e0 ?
假設n個獨立之常態隨機變數 ,其平均數分別為 ,
6 p+ ` K) O0 X8 y$ ~1 y0 g& G( F; e
組號 數 據 樣本變異
5 R: [6 u3 N: z
數
; J% l9 b- g$ c" N2 G5 ]: g
' D$ \6 \2 L- o# }
% _# k+ w# [( {5 V7 l& V6 }$ c( t7 P$ s! }
g2 u" i1 ?( y; {8 w/ r' L定義於常態分配之抽樣分配
, G7 U6 A/ Z b# T2 ^
假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
" q( b2 c6 M. U+ B$ i' e+ q
隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
* X5 Z3 _5 ?/ j. x y. i
限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
7 w% r& p. r0 g p- ~
抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
, g* d9 P* s; s7 g) s5 K括卡方分配( distribution)、t分配和F分配。
1 F/ k- k. D4 U; f& J# B/ ^, E
卡方分配
5 u! ^7 q8 o2 s假設n個獨立之常態隨機變數 ,其平均數分別為 ,
% N' q' X' L+ j, ~. [
組號 數 據 樣本變異
8 S: _9 I% I: B$ {' v( C6 y數
) B4 a7 b& E, x% ^/ r
9 K0 J/ s3 U' u5 H8 u
1 X1, X2,……,Xn
" A$ I" E0 R3 O0 H6 v8 h. G& K2 X1, X2,……,Xn
& i6 e# T, e8 o' h/ V% l' @
M M
; t* H8 `; Z" T
M M
) @1 ~6 `$ O6 V
k X1, X2,……,Xn
4 h8 V- g5 {& x9 F; G變異數為 。
2 {4 [( J# l( g$ J, c7 B' c0 h* x3 B. |) J- d* \3 Y
6 }1 h! }0 b" v) B2 g1 V