參見:數、排列與組合
貝氏定理托馬斯·貝葉斯命名,用以描述事件與事件的 條件概率之間的關係。
或者
貝氏定理的運用
一個國家有2%的人患上某種疾病。經由醫學檢測,97%的患者可被正確檢測出陽性結果,然而,也有9%的非患者的檢測出錯誤的結果。任意從該國家挑選一個人進行檢測,且檢測結果呈陽性。那麼,這個人真正患病的概率到底是多少呢?
直覺上我們會以為他患病的可能性極高,因為97%的陽性測試結果是正確的。然而,我們現在要從數學的角度進行分析:
- 表示事件“檢測結果呈陽性”
- 表示事件“檢測結果呈陰性”
- 表示事件“疾病患者”
- 表示事件“非疾病患者”
已知以下概率
-
-
現在運用條件概率的公式將有關事件的概率寫在下面的表格中:
|
(2%) |
(98%) |
|
真陽性
|
假陽性
|
|
假陰性
|
真陰性
|
現在假設一個人的檢測結果為陽性,那麼他真正患病的概率是多少呢?換言之,我們要求出條件下的概率,即。
從上面的表格中我們可以看出就是真陽性概率除以任何情況下測出陽性結果的概率,也即
使用貝氏定理公式也能得到同樣的結果:
結果似乎有點出乎意料。檢測結果呈陽性,但實際上他真正患病的概率並沒有我們想象中那麼高,只有18%左右。
為什麼會這樣呢?
通常在預測結果的時候,我們首先就會忘記患病人數佔總人口的比例非常小這一前提(患病人數只有2%),因此,即使檢測結果再精準,檢測結果為陽性的人真正患病的可能性也不見得極高。
我們可以這麼看,假設那個國家只有1000人,有20人患病(2%),這20人當中有19人檢測結果為陽性(97%的真陽性)。另外沒有患病的980人當中,大約88人也會拿到陽性檢測結果(9%假陽性)。
因此可把這1000人分成以下幾種情況:
- 19人檢測結果為真陽性
- 1人檢測結果為假陰性
- 88人檢測結果為假陽性
- 892人檢測結果為真陰性
從上面我們可以得出,大約(88+19)= 107人檢測結果為陽性(不論是否真的患病)。這107人當中又有多少人真的患病呢?只有19人,也即18%。
Jimmy Sie(著)
Amanda Huang(譯)
參見:數、排列與組合