參見:排列與組合


貝氏定理托馬斯·貝葉斯命名,用以描述事件A與事件的 條件概率之間的關係。

P ( AB ) = P ( BA ) P ( A ) P ( B )

或者

P ( AB ) = P ( BA ) P ( A ) P ( BA ) P ( A ) + P ( BA ) P ( A )

貝氏定理的運用

一個國家有2%的人患上某種疾病。經由醫學檢測,97%的患者可被正確檢測出陽性結果,然而,也有9%的非患者的檢測出錯誤的結果。任意從該國家挑選一個人進行檢測,且檢測結果呈陽性。那麼,這個人真正患病的概率到底是多少呢?

直覺上我們會以為他患病的可能性極高,因為97%的陽性測試結果是正確的。然而,我們現在要從數學的角度進行分析:

  • B表示事件“檢測結果呈陽性”
  • B表示事件“檢測結果呈陰性”
  • A表示事件“疾病患者”
  • A表示事件“非疾病患者”

已知以下概率

  • P(A)=2%
  • P(A)=98%
  • P(BA)=97%
  • P(BA)=9%

現在運用條件概率的公式將有關事件的概率寫在下面的表格中:

A (2%) A (98%)
B 真陽性 P ( BA ) = P ( A ) × P (B A ) = 2% × 97% = 1.94% 假陽性 P ( BA ) = P ( A ) × P (B A ) = 98% × 9% = 8.82%
B 假陰性 P ( BA ) = P ( A ) × P (B A ) = 2% × 3% = 0.06% 真陰性 P ( B A ) = P ( A ) × P (B A ) = 98% × 91% = 89.18%

現在假設一個人的檢測結果為陽性,那麼他真正患病的概率是多少呢?換言之,我們要求出B條件下A的概率,即P(AB)

從上面的表格中我們可以看出P(AB)就是真陽性概率除以任何情況下測出陽性結果的概率,也即

1.94% 1.94% + 8.82% = 18.03%

使用貝氏定理公式也能得到同樣的結果:

P ( AB ) = P ( BA ) P ( A ) P ( BA ) P ( A ) + P ( BA ) P ( A ) = 97% × 2% ( 97% × 2% ) + ( 9% × 98% ) = 1.94% 1.94% + 8.82% = 1.94% 10.76% = 18.03%

結果似乎有點出乎意料。檢測結果呈陽性,但實際上他真正患病的概率並沒有我們想象中那麼高,只有18%左右。

為什麼會這樣呢?


通常在預測結果的時候,我們首先就會忘記患病人數佔總人口的比例非常小這一前提(患病人數只有2%),因此,即使檢測結果再精準,檢測結果為陽性的人真正患病的可能性也不見得極高。

我們可以這麼看,假設那個國家只有1000人,有20人患病(2%),這20人當中有19人檢測結果為陽性(97%的真陽性)。另外沒有患病的980人當中,大約88人也會拿到陽性檢測結果(9%假陽性)。

因此可把這1000人分成以下幾種情況:

  • 19人檢測結果為真陽性
  • 1人檢測結果為假陰性
  • 88人檢測結果為假陽性
  • 892人檢測結果為真陰性

從上面我們可以得出,大約(88+19)= 107人檢測結果為陽性(不論是否真的患病)。這107人當中又有多少人真的患病呢?只有19人,也即18%。

Jimmy Sie(著)
Amanda Huang(譯)

參見:排列與組合