
機率解析:30 年內發生地震機率為 80%
簡介
封面圖片來自유유유 的礦場的舊玉里大橋,是兩個板塊的交界處。
CNA 在新聞中描述日本南海海槽30年內發生巨大地震機率升至約80%,這在機率上是什麼意思?而也會同樣關心的幾個問題:
- 明年發生地震機率多高?
- 地震發生的期望值為幾年?
- $t$ 年內發生地震機率多高?
- $t$ 年內發生 $n$ 次地震機率有多高?
- 已知 $t$ 年內發生 $n$ 次地震,那 $T$ 年內發生 $N$ 次地震機率有多高?
機率分佈
Geometric Distribution
若將每次地震視為獨立事件,則第 $k$ 年發生地震可以理解為,每年擲一次正面率 $p$ 的硬幣,正面即表示發生地震,那第 $k$ 次擲出第一次正面的機率即可以表示為連續擲出反面 $k - 1$ 次後,最後一次為擲出正面,即:
$$ \begin{align*} P (X = k) = (1 - p)^{k - 1} p \end{align*} $$在 $k$ 年內發生地震則可以被理解為,每年發生地震機率的總和,即:
$$ \begin{align*} P (X \leq k) & = \sum_{x = 0}^{k} P (X = x) \\ & = \sum_{x = 0}^{k} (1 - p)^{x - 1} p \\ & = p \cdot \frac{1 - (1 - p)^{k}}{1 - (1 - p)} \\ & = 1 - (1 - p)^{k} \end{align*} $$這樣的分佈稱為幾何分佈 (geometric distribution),寫成 $X \sim \text{Geom} (p)$,已經能回答一部份的問題,但這邊是以擲硬幣的次數作為描述,即限定 $k$ 為整數,若想更廣義的描述如 2.5 年內發生地震的機率,則會需要更廣泛的分佈。
Exponential Distribution
放寬 $k$ 為整數的限制,考慮非負數的範疇,即以 $x \in \bb [0, \infty)$ 取代 $k \in \bb N$,會發現
$$ \begin{align*} F (x; p) = 1 - (1 - p)^x \end{align*} $$仍為一個合理的累積分布函數 (cumulative distribution function, CDF),對其微分獲取機率密度函數 (probability density function, pdf):
$$ \begin{align*} f (x; p) & = -\ln (1 - p) e^{\ln (1 - p) x} \end{align*} $$若以 $\lambda = - \ln (1 - p)$ 取代,即可獲得:
$$ \begin{align*} f (x; p) & = \lambda e^{- \lambda x} \\ F (x; p) & = 1 - e^{- \lambda x} \end{align*} $$這樣的分佈稱為指數分佈 (exponential distribution),寫成 $X \sim \text{Exp} (\lambda)$,與幾何分佈的關係為:
$$ \begin{align*} \text{Geom} (p) & = \text{Exp} (- \ln (1 - p)) \\ \text{Exp} (\lambda) & = \text{Geom} (1 - e^{-\lambda}) \end{align*} $$透過這樣的轉換,我們足以描述發生時間為實數的問題,例如 2.5 年內發生地震的機率。
Gamma Distribution
最後考慮一種情況,$t$ 年內發生 $n$ 個地震的機率。已知可用 $X_1 \sim \text{Exp} (\lambda)$ 表述第一組地震的時間間隔分佈,並以 $P (X_1 \leq t)$ 表達在時間 $t$ 內發生的機率。
若以 $\contia{X}{n} \iid \text{Exp} (\lambda)$ 表述第 $\conti{n}$ 組地震的時間間隔分佈,則$t$ 年內發生 $n$ 個地震的機率可以被描述成:
$$ \begin{align*} P \left( \sum_{i = 1}^{n} X_i \leq t \right) \end{align*} $$要解答這問題,得將 exponential distribution 再推廣到更廣泛的分佈 Gamma distribution,關係為 $\text{Exp} (\lambda) = \text{Gamma} (1, \lambda)$ 與
$$ \begin{align*} Y = \sum_{i = 1}^{n} X_i \sim \text{Gamma} (n, \lambda) \end{align*} $$使得原始問題可以被描述為
$$ \begin{align*} P \left( Y \leq t \right) = F_Y (t; n, \lambda) = \frac{\gamma (n, \lambda t)}{\Gamma (n)} \end{align*} $$其中 $\Gamma$ 與 $\gamma$ 分別為 gamma function 與 incomplete gamma function。
問題解析
明年發生地震機率多高?
從 $k$ 年內發生地震的機率反推可得 $\text{Geom}$ 的參數 $p$ 為:
$$ \begin{align*} p = 1 - \left[ 1 - P (X \leq k) \right]^{1 / k} \end{align*} $$已知 30 年內發生地震機率為 80%,即 $P (X \leq k) = 0.8$ 與 $k = 30$, 因此 $p = 0.0522$。而明年就發生地震的機率即為設定 $k = 1$,計算得:
$$ \begin{align*} P (X = 1) = p \approx 0.0522 \end{align*} $$地震發生的期望值為幾年?
透過 geometric distribution 與 exponential distribution 的轉換關係,也可將地震的分佈表達為 $X \sim \text{Exp} (\lambda)$,其中
$$ \begin{align*} \lambda = - \ln (1 - p) \approx 0.0536 \end{align*} $$則地震發生的期望值即為各年加權,表示為
$$ \begin{align*} E [X] = \int_0^{\infty} x f (x; \lambda) dx = \frac{1}{\lambda} \approx 18.6567 \end{align*} $$$t$ 年內發生地震機率多高?
$t$ 年內發生地震機率即為:
$$ \begin{align*} P (X \leq t) = F (t; \lambda) = 1 - e^{-\lambda t} \end{align*} $$例如 $t = 0.5$ 年內發生地震機率為 0.0264。驗算原式,$t = 30$ 年內發生地震機率為 0.7997 (正常些微計算誤差)。$t = 50$ 內發生地震機率為 0.9314。
$t$ 年內發生 $n$ 次地震機率有多高?
$t$ 年內發生 $n$ 次地震機率即為:
$$ \begin{align*} P \left( \sum_{i = 1}^{n} X_i \leq t \right) = F_Y (t; n, \lambda) = \frac{\gamma (n, \lambda t)}{\Gamma (n)} \end{align*} $$此問題較難以運算,可用 Gamma Distribution Calculator,例如:
- 10 年內發生 2 次地震機率為 0.1013。
- 30 年內發生 1 次地震機率為 0.7997 (再次驗算,正常些微計算誤差)。
- 100 年內發生 5 次地震機率為 0.62026。
已知 $t$ 年內發生 $n$ 次地震,那 $T$ 年內發生 $N$ 次地震機率有多高?
這問題偏向統計問題,實務上並不會知道 $p$,因為蒐集到的資料往往是"過去 100 年發生過 10 次地震",而接著去推論"未來 30 年發生 2 次地震的機率有多高?"。
假設過去 $t$ 年發生 $n$ 次地震,則地震的分佈 $\text{Exp} (\lambda)$ 的 $\lambda$ 並不難估計:
$$ \begin{align*} \hat \lambda = \frac{n}{t} \end{align*} $$那接著 $T$ 年發生 $N$ 次地震的機率即為 :
$$ \begin{align*} F_Y (T; N, \hat \lambda) = \frac{\gamma (N, \hat \lambda T)}{\Gamma (N)} = \frac{\gamma (N, n T / t)}{\Gamma (N)} \end{align*} $$因此"過去 100 年發生過 10 次地震,未來 30 年發生 2 次地震的機率"則可以被描述為 $T = 30$、$N = 2$ 與 $\hat \lambda = 10 / 100 = 0.1$,使得機率為 0.8009。
後記
這篇文章純屬用機率的角度描述"$t$ 年內有 $p$ 的機率發生某事件",且假設事件是獨立的;然而地震是否為獨立還需驗證,且地震專家應有更多地震的線索,而非僅靠統計手段,因此這篇文章可以視為以一個純機率與統計的角度詮釋,而非以地震專家的角度描述。