單元目的
) F1 a5 S4 I7 ~4 P. y" q+ D
將宇宙間的事物與現象數量化、模型化,其主要的目的在於藉著科學的方
$ \, J& \8 O& c/ @
法,從這些事物與現象中,尋找期規律性,進而分析與探討其特性。在品
; I k* z: ~$ S% A6 r2 Q ?質管制中產品品質特性,就是一種機率分配(機率模型)。從管制圖上所
3 I6 o* }2 z9 D, ]* a) G7 g/ Y: t顯示的現象,我們可以了解製程的狀況;或由抽樣檢驗的結果,我們可以
S5 {$ U3 v# j( T% G5 f* o( |% A
判斷同批產品是否合格,主要都是依據統計學上的各種機率分配與統計量
/ w' V% \" h- ^) Z3 u9 }: R$ y2 J/ Q; c
有所了解。
6 S& _2 _& \* b+ \
單元大綱
, [# f: n) c, M/ S' [4 p
在本單元所介紹的常用分配,包括:
4 d4 N, e# R4 t& ~: {/ v一、基本機率論
% A" E! s" R0 }+ [$ C+ ?( B3 O
二、數據描述方法
/ N0 O# k7 ^+ X1 h
三、機率分配(群體分配)
9 Y- D) R& g; Z. ~2 O
1. 不連續機率分配(計數值分配)
. Q5 B5 L, a, [" X* M3 T
a. 超幾何分配(Hypergeometric Distribution)
0 c* V6 M9 P% W9 V% e) F. Cb. 二項分配(Binomial Distribution)
+ c# e+ }' L; f& }
c. 卜瓦松分配(Poisson Distribution)
3 ^( Y" A( U l' u/ Z% H% y
2. 連續機率分配(計量值分配)
" p' f* ]4 [! t0 |% S' N. i
a. 常態分配(Normal Distribution)
$ p% _0 i' m- c. o X四、統計量分配(抽樣分配)
' ^ Y2 {5 {# c& N
1.統計量之抽樣分配
* F' q" M) |/ j7 F5 [& |a. 樣本平均數( )之抽樣分配
, e! a, [( i: [% V; a5 t; p
b. 樣本全距(R)之抽樣分配
- F; s: T- `3 B7 l3 l$ ~) w2 X
c. 樣本標準差(S)之抽樣分配
" z3 Z7 ^ ~& |+ z5 v. D
d. 樣本變異數( )之抽樣分配
# W) _" A' M7 J6 Y8 f2 M
2.定義於常態分配之抽樣分配
/ v; I- E- g4 O
a. 卡方分配( distribution)
" V# g+ Q/ P8 j
b. t分配
( H$ e" ~" r' y0 t& Y, d
c. F分配
1 |- q0 H8 M; B8 t! Y, d
基本機率論
( W$ R" y, ~1 E8 ~3 O此部份的目的在介紹用在品質改善的基本的統計觀念與技術,因為統計在此扮
6 K1 }: S* H$ ?: \3 n& K* u4 U; L. E演一個重要的角色,藉由清楚地瞭解其相關的原理,使大家可以更知道其不同
k& m) |, t d
與未來結果的分析。
& B1 \9 r: R( i2 N0 U
母體與樣本(population and sample)
+ o6 g, ?' S) S+ ^+ U' z
母體(population):一組包括所有項目的集合。
+ q2 G: Y B6 I& uex:假設我們的目的是要知道七月份買進A廠牌湯罐頭的平均重量,
0 G. ^5 W* p2 r( |8 X$ r+ I/ A
則此case中的母體是公司七月買進所有A牌的罐頭(可能有50000罐),
) M6 u9 p0 g+ @6 K, v: y因為我們關心的是A牌的罐頭,所以即使公司還有買進其它牌子的罐
( q; z( _! F1 f9 \
頭,母體仍只限於A牌。
% w3 T) F" r: g8 C樣本(sample):母體的子集合。實際上,很多生產線上無法量測所有產品取得
# z! g; x3 y) [8 j7 W所需資料,因為處理如此多的資料非常耗時費工且不可行,利用部份母體中的
. q4 U s2 D# v; O& K
資料來代替在此時是一個可行的選擇。
) X3 x |" n" a6 g- G3 yex:承接上個例子,七月份買進的罐頭有50000個,樣本可能是隨機選
5 v% T3 R1 {8 ?# x( e, }0 ]
取500個。
" `; k) ~8 \( ?8 U' h+ _1 a- R/ n
參數與統計量(parameter and statistic)
- P6 |+ T; U9 P
參數(parameter):可以用來描述母體的一個特徵值。
$ b7 ?& M% ^# X: P$ Z
ex:以A牌的罐頭而言,平均值可說是50000罐罐頭的一個參數。
4 H- F" W5 h8 q' g6 R; @$ l統計量(statistic):是樣本用來推論未知的母體參數的特徵值。
7 I# O8 `" z" z! c; `' z# uex:500個隨機選取的罐頭平均重量可以來推論50000罐罐頭的平均
8 d- R' ^. }& q
值。
6 G4 O# i# w& `0 R8 ?. ^
機率(probability)
' X0 f; X# M2 A! N機率(probability):發生的可能性。機率函數介於0跟1之間,0表示沒有發生的
& m; F: g, Q3 S0 I5 M: {可能;1代表確定會發生。
3 Q5 g! a {/ i+ Q, c機率的相對頻率定義:如果樣本空間所有事件發生的可能性均相同,則事件A
% g% l- E" b; G的機率計算方法如下:
1 z; G$ n: g# k; `/ ^( z4 K
P(A) =
* H5 w& |$ b. a* z G9 v. cP(A):事件A的機率
: g" y8 J; V( l
:事件A發生的方法數目
, a# I5 Y i2 t
N:樣本空間的點數
2 B3 `$ K% I& n R8 |
這個定義是機率的相對頻率,只有在樣本空間所有事件的歷史資料均具備的情
8 @7 t i. z. o8 K1 `5 u
況才能使用。
. V% v, F' ?4 }, W8 E% H- q* [3 A
ex:擲一個骰子出現點數為單數的機率
' \" f! y' f1 t0 w$ v, }
假如事件A為擲一個骰子出現點數為單數,則
# J' [7 p; y. O& z
樣本空間S={1,2,3,4,5,6},事件A={1,3,5}
1 |: U' F L6 SP(A) = =
9 C0 G6 j/ w2 n O! K' V單純事件與複合事件(simple event and compound event)
# `% \( a5 E& t! n3 N w
單純事件:無法再分解的事件
& Q; g# `& A4 f/ R* m- |% m
複合事件:由2個以上的單純事件所組成的事件
0 v6 r: L: i- O' eex:檢驗從裝配線取得的2個電路版,檢查是否合格,試問何者是單純
. s6 }& h$ |; y# |4 W! f# u1 e事件?計算出至少有一個電路板合格的機率。
9 ~" \. m0 J3 N2 _) X2 o# Nsol:
5 u/ Y* ?& L5 \; g
:第一個電路板合格的事件
3 |6 t* y% _! h( B* w$ w:第二個電路板合格的事件
7 ^0 P! d0 g7 f, {0 {. s0 V3 V; A9 k
:第一個電路板不合格的事件
! V4 t G# B, g0 d' B5 n5 V5 k:第二個電路板不合格的事件
+ C+ y7 k' |8 _
樣本空間S由四個簡單事件所組成
8 q7 M# X6 L H2 y( xS = { , , , }
1 B; s8 I3 g3 B5 }1 v" L0 Y% ~各事件可以描述如下:
; K. ]( N* E) G4 k={ , }:第一與第二個電路板均合格的事件
4 H. ?4 `4 H& b/ o={ , }:第一個電路板合格但第二個不合格的事件
- X! T# Y0 t' j O5 S7 k d
={ , }:第一個電路板不合格但第二個合格的事件
7 V j! v6 _7 k2 [; m4 W: H={ , }:第一與第二個電路板均不合格的事件
1 k" l' h5 A* E, B* X$ L9 w3 E6 }# J如果事件B代表至少有一個電路板是合格的則B ={ , , },假
3 e5 w4 d6 F! r2 B2 o( m9 ~
設每個事件發生的機率皆相同,
9 K: j9 L" ~1 B3 T
1 S* z. c$ o# K5 V+ w7 E
5 i7 ~) P6 d3 |
6 |, ?5 w3 f( w9 y加法律:P(A∪B) = P(A or B or both) = P(A) + P(B) -P(A∩B)
' L# v% a9 a; ?4 b乘法律:P(A∩B) = P(A and B) = P(A)P(B∣A) = P(B)P(A∣B)
0 |% Q9 J/ p) x: \+ a
條件機率
8 w# E0 p- Q. C+ `$ ~# ?' }
P(B∣A)表示給定事件A下,事件B發生的條件機率。如圖
* M9 H1 v) X# @) v, o4 l' k* j
3 q0 ^& }& K/ ~. F9 v: X
獨立與互斥事件(independence and mutually exclusive event)
) B" Z- u+ U6 a& `; \獨立(independence):A與B的結果相互不會影響稱A與B獨立,所以假如A與B獨
% a' m) [9 w, M* C4 |8 b
立則P(B∣A) = P(B)或者P(A∣B) = P(A),此時P(A∩B) = P(A)P(B)
; q3 ^1 e( Y0 S' }6 F
互斥(mutually exclusive):A與B假如不能同時發生稱A與B為互斥事件,所以P(A
( Z9 B t( r' U0 A, \
∩B) = 0,P(A∪B) = P(A) + P(B)。因為如果A與B互斥,則兩者不能同時發生,
, s4 F1 s! |% v故A與B為相依事件。
1 u/ [8 o) P& c! c$ f
1 N: s* H" W$ X2 f$ x1 v5 g/ z' a例題:某鋼鐵公司生產鋼板,根據過去的經驗,有5%的鋼板長度不符合規格要求,有3%的鋼
# M6 e( e6 L6 F7 ~) {
板寬度不符合規格,假設長度與寬度的製程不相關,請問
8 M. H( ?4 S, [5 O7 v1 b* C
a.生產符合長寬規格的鋼板的機率有多少?
4 B, T5 H2 j. i9 i- B1 ^! D
b.鋼板的長或寬不符合規格的機率為何?
% t8 S* Q+ w; }: ]7 T$ Sc.鋼板的長與寬皆不符合規格的機率為何?
5 F0 q, R; s' A v) }
d.假設鋼板的長與寬的製程並非獨立的,如果長度不符合規格會使切削寬度時的夾具位置不
: \2 y6 N5 p9 Q. j
正確,使的寬度有可能不符合規格,從經驗得知長度不符合規格時,寬度不符合給格的比例
# ~' V$ ]2 C4 F! g1 f
是60%,請找出長寬同時都不合格的鋼板比例。
0 n3 |7 b0 w/ G- O. z4 A: I4 se.在(a)中A與B是否互斥?
7 V P0 `" ^+ K1 t
f.請描述如果A與B事件為互斥的情況下的情形。
1 S& Z% x( m P! t* N
sol: 假設A表示長度符合規格的產出;B表示寬度符合規格的產出
9 {* ?) |; h! s) g% ]a. 由題意知道P( ) = 0.05與P( ) = 0.03
/ U" {, D6 D0 y
P(A) = 1- P( ) = 1 - 0.05 = 0.95
3 I. ^4 C5 `3 g7 B2 ~
P(B) = 1- P( ) = 1 - 0.03 = 0.97
& ?) l' t& u) O- K1 S: \8 j
P(產出的鋼板長寬均符合規格的機率) = P(A∩B) = P(A)P(B) = 0.95 * 0.97 = 0.9215
9 P' U( o! I: u3 q& D, q
b. 鋼板的長或寬有一個不符合規格的機率 = P( or or both),從加法律得知:
9 { o z' C( \* q* }$ B* ]P( or or both) = P( )+P( )-P( ∩ )
, p! `8 }: n; K5 K" A
=0.05+0.03-(0.05)(0.03)
1 I! }9 G; H6 h- V
=0.0785
9 E: g. G! O" t2 d1 s4 a
所以有7.85%的工件長寬之中有一個不符合規格要求。
- i5 H' O" U7 Q& q
c. 題意是要找出P( ∩ ),而P( ∩ )=(0.05)(0.03)=0.015
' O1 C" n, Y; D @; L' T
所以有0.15%的工件會不符合長與寬的規格。
3 l) }1 s3 s4 _8 J0 ]& G
d. P( ∩ )是此題的目的,而且由題意得知P( ∣ )=0.60從乘法律知道P( ∩
. R/ a" w0 ^4 A R8 j# x/ x4 J)= P( )P( ∣ )=(0.05)(0.6)=0.03
! ?( Q& p/ s+ H/ H- ]+ _: {7 a所以有3%的鋼板的長與寬都不合格。
% T" _+ O; z" V9 D9 F, Le. 從(a)中得知 P(A) =0.95﹑P(B) =0.97﹑P(A∩B) = 0.9215,如果A與B互斥則 P(A∩B)應該等
3 j8 m% r% M) m" G( @( @& E/ W
於0,但是實際上並非如此,所以A與B不是互斥事件。
: j- w! r+ u# g) U9 y' R
f. 如果A與B事件為互斥則P(A∩B)=0,所以生產出的鋼板均不合格。
2 H: n, Q( {" k# U$ C( n5 }; W- _. H; v( [
數據描述方法
9 H0 r! h1 [: `4 \8 ^9 f% }/ @
[ 中央趨勢量| 分散度]
) N- y; I7 T! F0 L) R9 o
6 m3 |, v5 c$ W+ k1 V( W統計是一種收集﹑分類﹑分析與從資料中做出推論的科學,一般可將統計分為
3 F) }& B$ [2 t7 t- D8 |. O* R
敘述統計與推論統計。敘述統計是從收集的資料中取得描述產品或製程特徵
; z$ ?8 C+ M+ v8 M1 D% G量。而推論統計是利用抽樣所得的資訊對未知的製程參數做出結論。
3 G" h, U. P* O: I在此首先要介紹的是敘述統計,主要內容有:
# D% d# M1 D! e+ M$ ?: C1. 中央趨勢量的量測
* _ ~* w# Y( s/ E) }& }! B6 x+ Q. j
2. 分散度的量測
0 ~! Q& W* N9 v2 x/ N% a4 y
中央趨勢量的量測
o2 M( d4 m- e7 B1 V在SPC中,中央趨勢量的目的是指出資料所處的位置與集中的值,可以幫助我們
, F' E6 j9 K, N/ B! S: i
決定是否要更改製程的設定。包括下列數個具代表性的值:平均數﹑中數﹑眾
7 O* {/ t" J( P* Y; a數與截尾平均數。
- u9 C9 ^6 a4 S# f; d. V
a. 平均數(mean):
% ~9 P+ l( i! ~( y$ Z: u% p平均數在SPC中最常用來決定製程是否偏離目標值,樣本平均值以 表示,
5 L! f" W8 K* L3 R/ I= 。母體平均數以 表示, = 。
4 Y: }2 W! S* M' p7 I) S7 ~6 Y9 ]- y H例題a
* i( D2 Q3 m8 L6 c+ E- ^9 S4 m8 K' ^8 ?$ _; J# Q, l
b. 中位數(median):位於所有數值的中央稱為中位數,如果數值有偶數個,則取中間兩
, R( A& c9 z2 k2 b. N9 I a+ G個數的平均值當中位數。中位數的意義在於有50%的值小於或等於中位數。
3 g+ }, |+ m! }# a1 Q" X7 q0 X
因為中位數比起平均數而言,較不會被極端值影響,故中位數比較穩健。
2 p2 b0 K2 _1 c0 }7 K5 X% [$ P6 b+ r d0 E# b. {' i% q
c. 眾數(mode):出現次數最多的數稱為眾數
) k$ ]5 b' G; f5 W2 W$ h: Y- a/ Q
截尾平均數(trimmed mean):截尾平均是取介於第一與第三四分位數中所有值的平均,
( v; B4 C3 N) w3 g2 V
比起平均數,截尾平均數較不受特別大或特別小的值所影響。同時又不是只代表某個
# m. }% B8 v) V! _7 f: a6 C
出現頻率最高的值。
9 b- h3 v1 s/ ^* r. }+ i5 g$ i
9 |" v4 G0 ~, k& U' f, l分散度的量測
^' _0 D( S" Z9 ^5 t分散度的量測提供資料變化分散的程度是SPC的基礎之一
9 _% S8 f& r( t2 b( \- W2 l4 c1.Range:在一組資料中最大與最小的差
" Y% `+ b8 v5 z) G7 T3 `
R= Xc - Xs
/ Z0 Y/ L% l# W. j4 X5 a
↑ ↑
: V; d) T- P* z% F- C6 o7 v" _5 o最大 最小
" M& v. q5 F1 i( u' |
2.Variance 變異數:是測量觀測值均值變動的情形
$ B+ R1 _) x( a' c0 Y3.標準差
4 Q$ I) L; J+ A0 J+ k4 V4 l- N. y& N. S+ t6 i: f7 S# S
EX_a:隨機測量銀行顧客等待服務的時間分別為3, 2, 4, 1, 2分鐘。
' h: B" X! K- E- i& {% O0 E1 X樣本平均或平均等待時間: = 分鐘
* o4 x4 f2 q1 [, I; \
: c8 o: G& {6 m( f, Z
EX_b:隨機抽取十個活塞的直徑(公釐)分別如下:52.3, 51.9, 52.6, 52.4, 52.4, 52.1, 52.3, 52.0, 52.5,
$ M, F( G3 y/ T u2 k
52.5,請問中位數為多少?
/ B1 U# A7 j" J9 A# y% b
sol:將測量值排序後如下: 51.9, 52.0, 52.1, 52.3, 52.3, 52.4, 52.4, 52.5, 52.5, 所以中央兩個值分別為5
, ?3 A# n9 N2 ]2 a2 z與52.4,兩個值的平均數是(52.3+52.4)/2=52.35
' f% I1 O. B, A
9 _3 q0 l# |4 C' r/ N+ W
9 N% z' f) a1 ^( i A1 ]; vEX_c:某個建材行要決定該儲存何種尺寸的圓形鋸以因應顧客隨時的需求,隨機從歷史銷售資料
1 \% A" |! @: U* s8 p7 y取30個樣本如下:
, q; I3 V' J* Z7 n/ m1 l由下圖可知眾數是120,所以直徑120的圓形鋸優先考慮要儲存。
0 H$ N7 Y$ a2 d( t P
80 120 100 100 150 120 80 150 120 8
9 E& v! X! l6 _; e- R/ U120 100 120 150 80 120 100 120 80 1
( D# H$ i: B N' ^" e100 120 120 150 120 100 120 120 100
' O% O5 Q# ?6 G3 t G) q
. t- o3 D% F5 i, A機率分配
2 Z. H% K. n- G |0 Q( R) U[超幾何分配 | 二項分配 |卜瓦松分配 |常態分配 | 常用分配間之關係]
& d2 s' |' V4 Z7 W+ a+ E6 ]+ w
" r+ k7 |: X% V) A機率分配(Probability Distribution)
8 t. {# A! ?. D+ F# Q* [
機率分配是一個數學模式,用以描述一個隨機變數(X)所有可能值出現之機率。機率分配
1 T6 A0 G! _4 A2 o, v可分為連續和不連續兩種。
4 t: A; D. E& a) sa. 連續分配
3 t$ w5 }* Z# k/ K- z# k5 d
若一變數使以連續尺度來量測,則其機分配為連續。如產品之長寬高尺寸。隨機變數
* r$ r, e! u4 t+ j) V! rX落在a、b兩數值所界定之區域的機率為
A' T& n/ ^; h0 z! i' d
b. 不連續分配
* S: c' J8 Z- X x$ a9 a
若變數只能為某些特定值,則稱其機率分配為不連續或離散。如顧客數目。隨
2 e+ ]3 a" R7 Q3 @9 e% n% v
機變數X等於某特定值 之機率為
0 [ Y. V% j' |0 p/ hP{X= }=p( )
2 c- F) F' L z2 o2 n* ]
4 T Q4 M. c. K, U
' J0 M+ C( C7 _) I3 i% w
& d. @4 C" o( n Y6 G
超幾何分配
( n5 {- A$ v( x @4 D* z v) c! e從有限群體中,隨機抽取樣本而不放回時,需要採用超幾何(Hypergeometric)機率分配。
8 m" z4 h2 L" g7 R+ H6 R1. 定義
" e6 C8 _6 C; [- ~' b1 x# z
如果一批產品共有N件,其中r件不良,其餘N-r件為良品,現自該批產品中隨
8 ]3 i [- s! l# T6 E2 ?機抽取n(n≦N)件產品,則其中有x件不良品之機率為
5 a2 v! S! X, E' J/ w* d2 f) U
& U' d- @3 q6 b
" W% T4 b2 c u+ J9 T1 I
* r; A- W \" B9 e: Z/ _: L3 Z若不連續隨機變數x具有上式之機率分配時,稱為超幾何分配(Hypergeometric
4 v$ n% r) Y2 sDistribution)
4 H% ~* c0 D- i: K% r* n- Q
4 s* T7 y Z$ }1 O0 f) w+ U( A
0 r- ~, d* u. r/ ?: s
7 x$ f m& Y, c, ? Z二項分配
# t. ~# Y N+ n! Y. g% J) b4 O
1. 定義:假設X為不連續隨機變數,若其機率分配為
$ ]* W, `! R! ~1 Q% @; T7 U' v, t
,x = 0,1,2,…,n ,0<p<1
3 Y H1 c# |! j. F
f(x)=0, x=其他數
+ f: _6 |% U5 L5 H- e# O
則稱X具有二項分配(Binomial Distribution)一個隨機試驗,其結果可分為兩個互斥事件A和B(如成功與失敗、正面與反面
! _ b- b# a! I! j+ i等),若發生A事件之機率為p,而發生事件B之機率為1-p,將該隨機試驗重複
; k! d1 M, a% C* b3 v/ T8 F試行n次,其中事件A出現x次,則此隨機變數X餒具有二項分配,其計算方式如
: k& H! S/ i% s7 G) p9 w
下:
$ W6 ^* i9 y& F4 x) w/ S
假設在n次實驗中,最初x次全出現A事件,其餘(1-p)次全為B事件,如上圖,
& \! [/ m' q8 e" B$ v
此情況之機率為 然而此種組合共有 次,所以其機率為
# t# h4 x# E+ { k$ x' c。
. h$ U+ v- P( `: y8 N超幾何分配用於群體之批量有限個數,而且其取樣的方法是取出不放回。下列
3 Y" j- n+ a5 e7 S! f
三種情形應該採用二項分配:
8 u, h- d2 _1 E8 z, B9 ~
1. 群體批量為無限多。
" Q7 L: i$ W# ~) k- m5 u2. 群體之批量為有限數,但取樣方法為取出放回。
~1 j8 }/ L9 v& @
3. 群體之批量為有限數,因相當多,點算不便,且N>10n。
2 Q1 `. @% z( t @6 D
2. 二項式的展開
% h6 d) D$ w' X5 w
. L# U& E+ }7 ~" Z5 r; v4 t; k
; J( s! W) s, ~; Z p
! @( b3 ~/ I+ L1 w T
p:A事件發生的機率(例如,一個不良率)
% y+ |, a/ |' \
q=1-p:B事件發生的機率
- a/ ?& o3 y0 Bn:試驗次數或樣本大小
% ?+ _) Z% T) C3 A/ d" TA與B為互斥事件
% i' D! Y, I1 B. X3. 二項分配之平均數與變異數
. m3 v. N, X. I# R8 J2 ^3 B4 y平均數: =E(X)=np
7 f; C S8 i6 t- {0 G
變異數: =V(X)=np(1-q)=npq
6 z; T- a. B' r# a3 }+ @" ]p:群體不良率
8 m4 q4 f. Q$ G$ t5 Sq:1-p
- t; C g- E5 ^( l3 j5 d- D- B
, D' t& Z; ^4 Y! ]
1. 定義:如果x為不連續的隨機變數,具有機率分配
" j& N8 k' s4 N. L! w
4 A# |" \: C7 @ W2 g. y' D5 {
. E7 _5 M4 A0 X4 Z5 P則稱X具有卜瓦松分配(Poisson Distribution)。
2 g% `; l' G5 _3 `+ Z卜瓦松適用在樣本n很大,且不良率很小的場合。一般而言,可歸納下面三種情
3 i- J' d; t) y6 }( l) Z! s4 |) S
形:
1 k% e. Z2 `3 B) Z E% Aa. n ≧ 16
) w" t) x0 \( S, H' D) m, y
b. p ≦ 0.1
3 ^% A) s- A( X( \" W1 p) q1 _c. N ≧ 10n
1 h, q3 I' C: w k# O4 C
應用卜瓦松分配的實例很多,常見的有:
) m) ?6 N$ w0 G; C6 N" P% c# O' @4 Ya. 單位時間內的觀察值。例如便利商店每小時的顧客人數、每天機器故障台數
: P6 U h$ U9 Y; P# K$ O: L( Z等。
7 X) H* ]4 l8 j7 D
b. 每一單位數量內的觀察值。例如每平方公分內缺點數、一批產品上的缺點數
/ e) W3 a. U. F等。
2 h& \" c9 r* H- z/ R2 J
2. 卜瓦松分配的平均數與變異數
{. }5 }! T W, G2 ]" r8 t: u9 Z
平均數:μ=E(X)=C
" v5 T. n2 e3 O9 m變異數: =V(X)=C
: k% q4 Z% h7 C2 s3 f+ s0 u卜瓦松分配的平均數與變異數是計算缺點數管制圖之主要依據。若群體情況未
1 F# y! \! v" V3 \# {7 r
知,則以平均缺點數代替之。
! T1 l" A- [% W) p$ v
* R7 k; r* `: N) V常態分配
' U2 v: L9 {/ k* y5 s' u/ B1. 定義:連續隨機變數X具有機率密度函數
6 M" K: F5 X- A7 S# p9 r-∞<x<∞, σ>0, -∞<μ<∞μ
$ `/ U' H! d0 X" t: C2 A
則稱X具有常態分配(Normal Distribution),通常以N(μ, )表示。
# u* A2 p- ?- e3 o. A1 j: K
2. 常態分配之特性
2 Y, w, y8 h. d3 Z) h5 @
a. 自然界絕大部分現象之分配均屬常態分配,如身高、體重、品質特性觀察
q% }% l: p/ ~+ I* F ?
值等
3 U2 G% i# J! U; }6 [! z5 ^
b. 隨機變數x為連續變數,其定義域範圍介於。-∞與∞之間。
( V. C0 P3 x7 X3 h, @5 v8 e
c. 有兩個反曲點,在μ±σ處。
3 v& |6 ]. @5 l
d. 為一單峰對稱分配,呈鐘型,以平均數為中心左右對稱。
1 i/ M" s/ R0 g: {
e. 常態分配的形狀決定於兩個母數,即平均數μ與標準σ。如圖下
, R3 T" ^0 c' }# f nf. 曲線與X軸之間的面積總和等於1。
) q: i1 v% G/ T
1 p! A2 B) G8 Q
7 g) z( ]9 k8 n# s) c
" s" B. F+ [# r. ? f' F3. 標準常態分配
5 r5 r; q* H v" J為使常態分配的計算簡化,可以經由下面這個公式將所有的常態分配轉換成標準常態
$ D" E' O% g; _9 u( d3 ]分配(μ=0,σ=1):
+ g$ q7 j2 Y) `8 G經過轉換的標準常態分配機率值可以查表得知。。而其機率函數如下:
3 T3 W+ p! D, M: p& q2 _, -∞<z<∞
+ D1 ?- ^5 z/ z" y7 X% e: b
由標準常態曲線,可以進一步求得±3之間的面積為0.9973,±2之間的面積為0.9544,±1
+ Z- \1 {5 _1 j4 I& l2 J" M" ^9 Z之間的機率為0.6828,如圖所示,其中μ=0,σ=1。
o, \; h4 c* B
1 T' H" O) W4 q( g$ |
}9 o/ L2 @7 Q! Q) C
0 t9 l6 G, b& v; Q" L4 |( m4. 中央極限定理(Central Limit Theorem)
6 Z6 G3 C8 Y$ J2 j. f6 E; e+ d* h
中央極限定理應用於品質管制上,非常重要,因為從某一群體中,抽取n個樣本,其
, U! E+ j& o* Z9 C* I3 p品質特性之觀測值分別為X1, X2, …, Xn,平均數與變異數分別為 與 ,則令Y﹦
. @: D5 m( b* T" c! U* I8 Z9 @8 z9 G
。
2 l8 G* Z5 a6 x C2 A4 e$ T
當n→∞時,f(Y)為常態分配。
$ z0 A5 J# F! L% u1 [( b2 g因為一般產品的品質特性值,很難得知屬於何種分配,但是,從中央極限定理得知,
& k, M$ u7 b5 v
在未知群體分配時,只要抽樣的樣本n夠大,其平均數之隨機變數近似於常態分配,
, [, l$ o" H, @3 F9 l' K* E P5 ~
此定理提供了品質管制中的抽樣理論之學理根據。
5 H5 l' z) f( r' x
7 L6 h& e+ n2 U1 T常用分配間之關係
; A. L5 e4 r- f ]4 x& F c/ R
超幾何分配、二項分配、卜瓦松分配與常態分配之間關係可以用下表簡單說
" H) q6 L: S: _' ^% X4 h9 r/ J明:
2 y, R5 z8 _, T% l/ p
條 件 實 例 可用之近似值計算
" N; {5 P1 H3 v$ v
N>10n 批量為樣本數的10倍以上時 超幾何分配→二項分配
; I5 o; g; P% B8 v" ?1 }p≦0.10
* N2 g9 @7 W, @
np>5
8 U& C5 Q2 H* N! q+ P1 ~# N& H不良率在10%以下,n很大,但
+ ~4 h% M, W: b3 o% B
不良數不超過5個時
8 m7 O# e+ R1 M( q- S2 K
二項分配→卜瓦松分配
' e( a5 _- r0 d( ]9 Y) i
p<0.50
, s' \: N4 @2 a$ R& h- Znp>5
+ Z! {+ O" `0 k
不良率在50%以下,n很大,但
& o# @( v0 U* { x# J" a4 Q不良數在5個以上時
0 t% I1 Q5 M J c7 }. B二項分配→常態分配
! d% J3 L" S9 U, pnp>10 樣本數很大,不良數有10個以
. I' j9 z8 v: ]6 i4 x/ X
上時
D% J+ M7 y/ a* ^6 m3 s卜瓦松分配→常態分配
J9 k% F% i/ e; t: L( y
$ N* [3 {/ y; `9 |
抽樣分配
2 F c2 u6 M1 S[ 統計量之抽樣分配| 定義於常態分配下之抽樣分配 ]
8 {* K' {6 \0 C0 I
- Z/ v1 o# }# c8 [0 P
統計量之抽樣分配
0 X& l% K, g0 ?0 }: R& Z% H5 O
在研究宇宙間的現象時,由於人力或財力所限,無法對整個群體觀察研究,致使
' F( W; t9 J5 | [) s. @$ o- c# Q {/ v無法獲知群體所蘊藏的某種特性,但若能依據某種法則由群體中抽取樣本,即可
2 f* }6 O$ h( d由樣本去推測群體之特性或相互關係。
% p [$ X( J% ^: |% A
. b( `- W/ ^# S$ a
5 n( Q5 G6 }! V( R6 c: z+ a: X# K ~* k
1. 樣本平均數( )之抽樣分配
8 g- M4 k/ s4 N$ w% X) P假設X為平均數E(X)= 及變異數V(X)= 之隨機變數, 為大小等於n之樣本平均
8 m" o" ?1 c) A; o! d! X數,則
+ v; E2 {5 _6 F0 Z9 O* u
- |" I. f0 j5 W
: @* Z, }; k- y
9 Z0 @) O4 z/ z/ o" r
% l3 X- a5 Z$ `, U1 B
+ w: O+ b( Q8 M# @# y0 t∴不論群體為何種分配,若由群體中抽取大小為n之樣本,樣本平均數分配之平均數等
; C% K% Q3 ~0 I9 g
於群體的平均數,而樣本平均數之變異數等於群體變異數除以樣本大小之商。
8 X) q! u! [ Z! B, r7 Z+ p
* w. K' U$ _5 W7 @( X1 x7 p
1 {) m& r/ P S n: @
6 z4 G5 M$ Q8 o+ V6 P
例16:X是常態分配N(30,9),假如從X中隨機抽取大小為5之樣本,使樣本平均數
6 D4 T1 k) z0 k: H# O0 P6 ]構成一抽樣分配,則其平均數與變異數分別為多少?
, L X( X. o6 O: nSol:E( )= =30
( I B, L4 d" ^6 H* i
V( )= =1.8
, n9 f- M4 h8 ~ f6 T, r9 }7 V# Y6 ~3 `* u7 J
' e1 U* v' V! F9 g* q
+ C( S) t% P$ N# ]% K
9 [5 i1 \' |5 X$ M* d" g5 T6 p9 ~( _5 o0 u
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
" }" J8 a' |2 y5 G
0 \3 \) Q' n! Z$ \3. 樣本標準差(S)之抽樣分配
; ?; X! h8 h8 K' R+ w
6 [+ r2 J3 ^2 D% p4 r5 _$ X& H
0 F8 q) ^4 E1 } m, m
+ U* \3 W& ^, y) }, p- V2 L# q
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配不是一個常態分配。
5 Y8 Y8 \2 I* o* H
" n/ D8 d. }0 v1 h' R5 r1 L0 z2 i4. 樣本變異數( )之抽樣分配
* g+ d- ?; q; O9 L2 Y" FM M
9 r9 G5 ?' c9 V* Dk X1, X2,……,Xn Rk
K1 U+ Z! r4 L& h2 h5 c. G 組號 數 據 樣本標準
+ c1 H* q' o& O
差
, \/ [3 M9 g2 N1 V, _. L6 S1 X1, X2,……,Xn S1
5 Y2 `& y: k* R0 n1 c2 X1, X2,……,Xn S2
% e' N; C2 r* ^" d! [" h; T7 Y: e
M M
0 i, t# B& l0 g- @6 F; mM M
) a- k( u+ h" u2 F5 S8 V4 Gk X1, X2,……,Xn Sk
% i$ s- a7 U6 f9 T2 n" N7 c0 |- M& X/ w& ]4 n- ^
E( S)=
' o1 f; @1 I- s/ [* X
各樣本全距抽樣分配之平均數為 ,標準差為 。但此分配
( z, d/ B+ x* Q: f( ]5 T1 o不是一個常態分配。
& _" q3 r3 J, s) X% i; z% \4 Q- y- U/ c6 g( j! U/ U
; _6 Q2 `) V0 J; w定義於常態分配之抽樣分配
: Q8 \% ?# D! K$ F+ Y0 b1 b4 y$ q2 C
假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
# F( p( \- r G4 d0 j2 y
隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
5 A; X0 T( \/ N' Y$ E: f) u限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
% |# _. C3 r8 B; o
抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
" |) x7 G) G _2 |4 h# H U+ E括卡方分配( distribution)、t分配和F分配。
6 V" |' l% x2 a: n+ H卡方分配
' S8 T5 v- i, E! R) J! L$ \1 Z
假設n個獨立之常態隨機變數 ,其平均數分別為 ,
2 j+ b G/ T2 i3 n' p P* b
組號 數 據 樣本變異
- W) x) U' O0 P2 i' A
數
# A. B9 w! O. w& Z/ @2 X
) }6 b8 v' C8 G
* ?/ H8 U K4 i* j( R
% W/ S/ Y8 ^3 {3 c" R2 Z* v" N
. v" b# p, a- k3 f: ?定義於常態分配之抽樣分配
# A) \; y5 Q+ M3 ~8 O8 T
假設X為具有平均數μ和變異數 之常態分配。若 為樣本數n之
' N# w& u7 ? f d6 `& I5 N0 Y, q
隨機樣本,則樣本平均數 將會符合 之分配。另外,根據中央及
A2 G1 h; r0 g; Y( f
限定裡可知,即使母體不為常態分配,當樣本數n逐漸增大時,樣本平均數 之
% {# \# l8 e; Q I+ @抽樣分配將會趨近於常態分配。以下將介紹數種定義於常態分配之抽樣分配,包
8 c5 M4 a) `# b8 P$ }; R- E6 Z括卡方分配( distribution)、t分配和F分配。
E* e" P- _- j6 E
卡方分配
+ ?; k4 X) X! P7 i; _9 N' D1 m" e
假設n個獨立之常態隨機變數 ,其平均數分別為 ,
% ]7 R( `# g0 F1 Q, n
組號 數 據 樣本變異
; P9 B, U3 B) h: |3 f數
/ ]" O B1 c( a n
$ p2 x" Z+ s, f" o2 U1 X1, X2,……,Xn
. q5 B" w: V; l- h' I8 ^
2 X1, X2,……,Xn
" s0 R) |7 S: Q! W, {9 e: a
M M
' l5 Y8 j3 I* {9 I, z: _
M M
* H2 L! ^. \2 H/ L% A+ Tk X1, X2,……,Xn
8 u3 O0 j7 D% A" ]
變異數為 。
3 G& |# i( `& ?2 M/ e3 [- n+ ]0 {
2 M% p# x* \5 Q
. v2 \9 U5 y, s9 `! v: d, @