圓州率
🌐

Feature Image

機率解析:30 年內發生地震機率為 80%

數學, 機率論
日本在發生規模 6.6 地震後,專家評估 30 年內發生巨大地震機率提升至 80%,如何從機率的角度評估這件事。
   最後更新:

簡介

封面圖片來自유유유 的礦場舊玉里大橋,是兩個板塊的交界處。

CNA 在新聞中描述日本南海海槽30年內發生巨大地震機率升至約80%,這在機率上是什麼意思?而也會同樣關心的幾個問題:

  • 明年發生地震機率多高?
  • 地震發生的期望值為幾年?
  • tt 年內發生地震機率多高?
  • tt 年內發生 nn 次地震機率有多高?
  • 已知 tt 年內發生 nn 次地震,那 TT 年內發生 NN 次地震機率有多高?

機率分佈

Geometric Distribution

若將每次地震視為獨立事件,則第 kk 年發生地震可以理解為,每年擲一次正面率 pp 的硬幣,正面即表示發生地震,那第 kk 次擲出第一次正面的機率即可以表示為連續擲出反面 k1k - 1 次後,最後一次為擲出正面,即:

P(X=k)=(1p)k1p \begin{align*} P (X = k) = (1 - p)^{k - 1} p \end{align*}

kk 年內發生地震則可以被理解為,每年發生地震機率的總和,即:

P(Xk)=x=0kP(X=x)=x=0k(1p)x1p=p1(1p)k1(1p)=1(1p)k \begin{align*} P (X \leq k) & = \sum_{x = 0}^{k} P (X = x) \\ & = \sum_{x = 0}^{k} (1 - p)^{x - 1} p \\ & = p \cdot \frac{1 - (1 - p)^{k}}{1 - (1 - p)} \\ & = 1 - (1 - p)^{k} \end{align*}

這樣的分佈稱為幾何分佈 (geometric distribution),寫成 XGeom(p)X \sim \text{Geom} (p),已經能回答一部份的問題,但這邊是以擲硬幣的次數作為描述,即限定 kk 為整數,若想更廣義的描述如 2.5 年內發生地震的機率,則會需要更廣泛的分佈。

Exponential Distribution

放寬 kk 為整數的限制,考慮非負數的範疇,即以 x[0,)x \in \bb [0, \infty) 取代 kNk \in \bb N,會發現

F(x;p)=1(1p)x \begin{align*} F (x; p) = 1 - (1 - p)^x \end{align*}

仍為一個合理的累積分布函數 (cumulative distribution function, CDF),對其微分獲取機率密度函數 (probability density function, pdf)

f(x;p)=ln(1p)eln(1p)x \begin{align*} f (x; p) & = -\ln (1 - p) e^{\ln (1 - p) x} \end{align*}

若以 λ=ln(1p)\lambda = - \ln (1 - p) 取代,即可獲得:

f(x;p)=λeλxF(x;p)=1eλx \begin{align*} f (x; p) & = \lambda e^{- \lambda x} \\ F (x; p) & = 1 - e^{- \lambda x} \end{align*}

這樣的分佈稱為指數分佈 (exponential distribution),寫成 XExp(λ)X \sim \text{Exp} (\lambda),與幾何分佈的關係為:

Geom(p)=Exp(ln(1p))Exp(λ)=Geom(1eλ) \begin{align*} \text{Geom} (p) & = \text{Exp} (- \ln (1 - p)) \\ \text{Exp} (\lambda) & = \text{Geom} (1 - e^{-\lambda}) \end{align*}

透過這樣的轉換,我們足以描述發生時間為實數的問題,例如 2.5 年內發生地震的機率。

Gamma Distribution

最後考慮一種情況,tt 年內發生 nn 個地震的機率。已知可用 X1Exp(λ)X_1 \sim \text{Exp} (\lambda) 表述第一組地震的時間間隔分佈,並以 P(X1t)P (X_1 \leq t) 表達在時間 tt 內發生的機率。

若以 X1,X2,,Xni.i.d.Exp(λ)\contia{X}{n} \iid \text{Exp} (\lambda) 表述第 1,2,,n\conti{n} 組地震的時間間隔分佈,則tt 年內發生 nn 個地震的機率可以被描述成:

P(i=1nXit) \begin{align*} P \left( \sum_{i = 1}^{n} X_i \leq t \right) \end{align*}

要解答這問題,得將 exponential distribution 再推廣到更廣泛的分佈 Gamma distribution,關係為 Exp(λ)=Gamma(1,λ)\text{Exp} (\lambda) = \text{Gamma} (1, \lambda)

Y=i=1nXiGamma(n,λ) \begin{align*} Y = \sum_{i = 1}^{n} X_i \sim \text{Gamma} (n, \lambda) \end{align*}

使得原始問題可以被描述為

P(Yt)=FY(t;n,λ)=γ(n,λt)Γ(n) \begin{align*} P \left( Y \leq t \right) = F_Y (t; n, \lambda) = \frac{\gamma (n, \lambda t)}{\Gamma (n)} \end{align*}

其中 Γ\Gammaγ\gamma 分別為 gamma functionincomplete gamma function

問題解析

明年發生地震機率多高?

kk 年內發生地震的機率反推可得 Geom\text{Geom} 的參數 pp 為:

p=1[1P(Xk)]1/k \begin{align*} p = 1 - \left[ 1 - P (X \leq k) \right]^{1 / k} \end{align*}

已知 30 年內發生地震機率為 80%,即 P(Xk)=0.8P (X \leq k) = 0.8k=30k = 30, 因此 p=0.0522p = 0.0522。而明年就發生地震的機率即為設定 k=1k = 1,計算得:

P(X=1)=p0.0522 \begin{align*} P (X = 1) = p \approx 0.0522 \end{align*}

地震發生的期望值為幾年?

透過 geometric distribution 與 exponential distribution 的轉換關係,也可將地震的分佈表達為 XExp(λ)X \sim \text{Exp} (\lambda),其中

λ=ln(1p)0.0536 \begin{align*} \lambda = - \ln (1 - p) \approx 0.0536 \end{align*}

則地震發生的期望值即為各年加權,表示為

E[X]=0xf(x;λ)dx=1λ18.6567 \begin{align*} E [X] = \int_0^{\infty} x f (x; \lambda) dx = \frac{1}{\lambda} \approx 18.6567 \end{align*}

tt 年內發生地震機率多高?

tt 年內發生地震機率即為:

P(Xt)=F(t;λ)=1eλt \begin{align*} P (X \leq t) = F (t; \lambda) = 1 - e^{-\lambda t} \end{align*}

例如 t=0.5t = 0.5 年內發生地震機率為 0.0264。驗算原式,t=30t = 30 年內發生地震機率為 0.7997 (正常些微計算誤差)。t=50t = 50 內發生地震機率為 0.9314。

tt 年內發生 nn 次地震機率有多高?

tt 年內發生 nn 次地震機率即為:

P(i=1nXit)=FY(t;n,λ)=γ(n,λt)Γ(n) \begin{align*} P \left( \sum_{i = 1}^{n} X_i \leq t \right) = F_Y (t; n, \lambda) = \frac{\gamma (n, \lambda t)}{\Gamma (n)} \end{align*}

此問題較難以運算,可用 Gamma Distribution Calculator,例如:

  • 10 年內發生 2 次地震機率為 0.1013。
  • 30 年內發生 1 次地震機率為 0.7997 (再次驗算,正常些微計算誤差)。
  • 100 年內發生 5 次地震機率為 0.62026。

已知 tt 年內發生 nn 次地震,那 TT 年內發生 NN 次地震機率有多高?

這問題偏向統計問題,實務上並不會知道 pp,因為蒐集到的資料往往是"過去 100 年發生過 10 次地震",而接著去推論"未來 30 年發生 2 次地震的機率有多高?"。

假設過去 tt 年發生 nn 次地震,則地震的分佈 Exp(λ)\text{Exp} (\lambda)λ\lambda 並不難估計:

λ^=nt \begin{align*} \hat \lambda = \frac{n}{t} \end{align*}

那接著 TT 年發生 NN 次地震的機率即為 :

FY(T;N,λ^)=γ(N,λ^T)Γ(N)=γ(N,nT/t)Γ(N) \begin{align*} F_Y (T; N, \hat \lambda) = \frac{\gamma (N, \hat \lambda T)}{\Gamma (N)} = \frac{\gamma (N, n T / t)}{\Gamma (N)} \end{align*}

因此"過去 100 年發生過 10 次地震,未來 30 年發生 2 次地震的機率"則可以被描述為 T=30T = 30N=2N = 2λ^=10/100=0.1\hat \lambda = 10 / 100 = 0.1,使得機率為 0.8009。

後記

這篇文章純屬用機率的角度描述"tt 年內有 pp 的機率發生某事件",且假設事件是獨立的;然而地震是否為獨立還需驗證,且地震專家應有更多地震的線索,而非僅靠統計手段,因此這篇文章可以視為以一個純機率與統計的角度詮釋,而非以地震專家的角度描述。