機率論建構
引入機率論會使用到的集合論、極限、sigma-Field 的基本概念,並用測度論的方始討論機率測度。
引言
封面故事是用機率的方式計算出圓周率 π,重複 n 次獨立取出兩個介在 (0,1) 的數 X 與 Y,定義 m 是 X2+Y2≤1 成立的次數,會發現隨著 n 上升,4m/n 會逐漸往 π 收斂,這就是靠採樣逼近圓周率的方式。

由 Laplace 首次定義機率為"目標事件數 / 總事件數",然而這隱藏了每個事件都是同等機率 (equally likely),且僅適用於有限 (finite) 事件,其適用性太低,因此我們會透過測度論的方式建構整個機率體系。
機率空間 (Probability Space)
定義 Ω 是蒐集所有可能樣本的集合,稱為樣本空間 (sample space),任意 x∈Ω 稱為樣本 (space)。F 是蒐集 Ω 子集合的集合,稱為事件空間 (event space),任意 E∈F 稱為事件 (event)。而評估事件發生機率的函數 P:F→[0,1],稱其為機率函數 (probability function)。本段的目標在於建構出一個合理的 (Ω,F,P) 稱為 機率空間 (probability space)。
例如骰子,其樣本空間就是
Ω={1,2,3,4,5,6}若我們關注的是"點數是奇數或偶數"的事件,則可以定義
F={{1,3,5},{2,4,6}}假設這顆骰子是公正的,則擲出偶數與奇數的事件理應相同,寫作
0.5=P({1,3,5})=P({2,4,6})因此可以稱 (Ω,F,P) 為"骰子點數是奇數或偶數"的機率空間。根據這個例子會發現,Ω 是自然產生的,F 是針對問題建構的,P 也可能因為是非公正骰子而有所改動,因此我們需要定義 F 和 P 的建構規則。
Sigma-Field
建構事件空間 F 時,我們需要確保其在集合操作下的封閉性 (closure)。F 被稱為 σ-field (sigma-field),如果其滿足
- Ω∈F
- 若 E∈F,則 Ec∈F
- 若 E1,E2,⋯∈F,則 ⋃i=1∞Ei∈F
根據 De Morgan's laws,若 F 是 σ-field 且 E1,E2,⋯∈F 則 ⋂i=1∞Ei∈F。且 ∅ 與 Ω 存在於所有 σ-field。
Partition Construction
給定一個可數 Ω,從 Ω 的切分 (partition) 開始建構一個 σ-field,定義 ε={E1,E2,⋯} 是 Ω 的 partition 滿足
- 互不相交 (pairwise disjoint): Ei∩Ej=∅ 對任意 i=j
- 且 ⋃i=1∞Ei=Ω
則可以寫作 F gnerated from ε
F=σ(ε)=P(ε)={S:S⊆ε}其中 P(ε) 是指 ε 的 power set。
例如 Ω={1,2,3},令 ε1={{1},{2},{3}} 和 ε2={{1,2},{3}},則
F1F2=σ(ε1)={∅,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}},=σ(ε2)={∅,{1,2},{3},{1,2,3}}對於有限 ∣ε∣=n,其建構的 σ-field 元素數量會是 2n。
Borel Sigma-Field
此時若 Ω 是不可數,例 Ω=[0,1],以 F=σ({x}x∈Ω) 建構方式雖然仍然是 σ-field,但不存在機率測度適用於此 F。
取而代之,會利用 Borel 建構方式,稱為 Borel σ-field
B=σ([x,y)x<y∈Ω)例如 [0,1] 上的 Borel σ-field,{1}=[0,1)∈B,而任意 x∈[0,1),{x}=⋃i=1∞[x,x+1/i)∈B,因此 [0,1)∈B。而實數 R 上的 B 能透過上述相同方式證明 Q∈B,根據封閉性得到 Qc∈B,從而使 R∈B。
測度 (Measure)
接著要引入測度 (measure) 概念,目標是用個集合函數 (set function) μ 來描述集合的大小。現給定 Ω 上的 σ-field F,稱一個集合函數 μ:F→R 是個測度 (measure),若其滿足
- μ(E)≥0 對任意 E∈F
- μ(∅)=0
- 可數可加性 (countalbe addivity): 對任意 {Ei:i∈N}⊂F 且互不相交,則
μ(i=1⋃∞Ei)=i=1∑∞μ(Ei)
稱 (Ω,F) 為可測空間 (measurable space),稱 F 為可測集 (measurable sets),稱 (Ω,F,μ) 為測度空間 (measure space)。
對應 Borel σ-field 的測度稱為 Lebesgue measure,定義為
L([x,y))=y−x若 μ 的輸出值都是有限的,即 μ(E)<∞ 對任意 E∈F,則稱 μ 為 σ-finite measure。目標建構的機率空間就是測度空間的一個特例。
機率測度 (Probability Measure)
在可測空間 (Ω,F) 上,機率測度 P 是一種 σ-finite measure,其滿足
- P(Ω)=1
- P(A)∈[0,1],對任意 A∈F
- P(⋃i=1∞Ai)=∑i=1∞P(Ai) 對任意互不相交 {Ai}i=1∞⊆F
其自然擁有的性質
- P(Ac)=1−P(A)
- P(∅)=0
- 若 A⊂B,則 P(A)≤P(B)
- P(A∪B)=P(A)+P(B)−P(AB),其中 AB=A∩B
- Inclusion exclusion formula:
P(A1∪⋯∪An)=i=1∑nP(Ai)−i1≤i2∑P(Ai1Ai2)+⋯+(−1)r+1i1≤⋯≤ir∑P(Ai1⋯Air)+⋯+(−1)n+1P(A1⋯An)
機率連續性
本段的目標在討論,給定事件序列 {En}n=1∞ ,在滿足何種條件下 P 與 lim 具有交換性,即討論
n→∞limP(En)=?P(n→∞limEn)其中需先定義集合序列 {En}n=1∞ 的極限
n→∞liminfEn=n=1⋃∞i=n⋂∞Eiandn→∞limsupEn=n=1⋂∞i=n⋃∞Ei若 liminfnEn=limsupnEn ,則定義 limnEn 存在且
nlimEn=nliminfEn=nlimsupEn其擁有性質是
liminfnEn⊆limsupnEn
證明
nliminfEn=n=1⋃∞i=n⋂∞Ei=(i=1⋂∞Ei)∩(n=2⋃∞i=n⋂∞Ei)⊆i=1⋂∞Ei=n=1⋂∞En=n=1⋂∞i=n⋃nEi⊆n=1⋂∞i=n⋃∞Ei=nlimsupEn(liminfnEn)c=limsupnEnc
證明
(nliminfEn)c=(n=1⋃∞i=n⋂∞Ei)c=n=1⋂∞(i=n⋂∞Ei)c=n=1⋂∞i=n⋃∞Eic=nlimsupEnc若 {En} 是遞增的 (En⊆En+1),則 limnEn=⋃n=1∞En
證明
因為 {En} 是遞增的,所以 ⋂i=n∞Ei=En
n→∞liminfEn=n=1⋃∞i=n⋂∞Ei=n=1⋃∞Ei另一邊,⋃i=n∞Ei=⋃i=1∞Ei 所以
n→∞limsupEn=n=1⋂∞i=n⋃∞Ei=n=1⋂∞i=1⋃∞Ei=i=1⋃∞Ei因此
n→∞limEn=n→∞liminfEn=n→∞limsupEn=i=1⋃∞Ei若 {En} 是遞減的 (En⊇En+1),則 limnEn=⋂n=1∞En
最後推論出的性質是,若 limnEn=E,則機率測度 P 與極限 lim 具有交換性,即
n→∞limP(En)=P(E)=P(n→∞limEn)證明
證明分兩步,第一步先證明當 En 是單調的 (monotone,即遞增或遞減的) 會滿足交換性,第二步再證明 limnEn=E 時滿足交換性。現假設 {En} 是遞減的,則
n→∞limP(En)=n→∞limP(i=1⋃nEn)=n→∞limP(i=1⋃nEn\En−1)=n→∞limi=1∑nP(En\En−1)=i=1∑∞P(En\En−1)=P(i=1⋃∞En\En−1)=P(n→∞limEn)({En}遞減)(任意n,En\En−1互不相交)(σ-field定義3)(σ-field定義3)若 {En} 是遞增的,則 {Enc} 會是遞減的,因此能套用上式
n→∞limP(En)=n→∞lim1−P(Enc)=1−n→∞limP(Enc)=1−P(n→∞limEnc)=P[(n→∞limEnc)c]=P(n→∞limEn)最後,對於滿足 limnEn=E 的情況,定義 An=⋃i=n∞Ei,則 {An} 是遞減的且
P(n→∞limEn)=P(n→∞limsupEn)=P(n=1⋂∞i=n⋃∞En)=P(n=1⋂∞An)=n→∞limP(An)相似的,定義 Bn=⋂i=n∞Ei,則 {Bn} 是遞減且
P(n→∞limEn)=P(n→∞liminfEn)=n→∞limP(Bn)由於
Bn=i=n⋂∞Ei⊆En⊆i=n⋃∞Ei=An因此
P(Bn)≤P(En)≤P(An)最後根據 limn→∞P(Bn)=limn→∞P(An),夾擠出
P(n→∞limEn)=n→∞limP(En)隨機變數 (Random Variable)
隨機變數 (random variable) X 是從樣本空間映射至實數的函數,即 X:Ω→R。給定一個 σ-field F,稱 X 是 F-measurable 的,若任意 Borel set B,
X−1(B)={ω∈Ω:X(ω)∈B}∈F要求 X 是 F-measurable,是因為用數字 (R) 表達事件 (Ω),並套用機率測度 P:F→R,因此要求 X 是能被 F 刻劃的。
也經常用區間描述,例如
X−1((−∞,x])={X≤x}={ω∈Ω:X(ω)≤x}∈F分布函數 (Distribution Function)
用函數 F:R→[0,1] 來描述隨機變數 X 累積的機率分布,稱為 累積分布函數 (cumulative distribution function, cdf)
F(x)=P(X≤x)然而以此定義的 F 牽涉到隨機變數 X (與背後的 σ-field F),若僅給定一個函數 F,稱其是個 cdf 若其滿足
- limx→−∞F(x)=0
- limx→∞F(x)=1
- 單調 (monotonic increasing):若 x1≤x2 則 F(x1)≤F(x2)
- 右連續 (right continuous):limx→c+F(x)=F(c)
參考資料
- A Second Course in Probability, S. M. Ross, E. A. Pekoz