koji/メガネ男の日誌

日々の学び、活動状況を記録します。仕事のことは少なめ。

統計数字に直感は欺かれる

f:id:kj_man666:20200125111743j:plain

(2020/3/15 追記)Nさんにコメントでご指摘いただきました、陽性尤度比を追記しました!

 

旬は過ぎてしまったかもしれませんが、統計を学ぶ身として気になるtogetterをみかけて、『本当にそうなの?』となったので調べてみました!

togetter.com

 ざっくりいうと、感度、特異度が高いので、これはすごい精度で発見できるに違いない、という印象を受けてしまうが、実際数字をはじいてみると、状況によってはそうでない場合もある、というものです。

※なお、当ブログはこのサービスを批判するモノではなく、純粋に統計を学ぶ趣旨ですし、このサービスの会社さんも、必ずないし高い確率でガンを発見するということは言っておりません。

 

 エヌノーズさんは、線虫という小さな生物が持つ特性を使って、ガンを感度85%、特異度85%で発見するサービスを開始したそうです。

xn--icktbzci4u.com

 それを見た方が、これはすごい、自分もやりたいし、親にもやってあげたいなあ、とツイートされたところ、いや、それは場合によってはそうと言い切れないこともある、という批評があったわけです。

 

 大まかな流れを書きますと、

 

 感度・特異度85%(後ほど言葉の意味を解説します)という高い精度でも、病気の発生率が1%という低いものであった場合、病気だと言われた診断が正しい確率は、約5.4%と低く、感覚とズレてしまう。

 統計結果と感覚がずれることはままあるものの、そこまでかいな!?と思った私はもうすこし噛み砕くべく、調べてみました。

 

 まず、病気(陽性)を診断する場合の確率には、先ほど記述した感度、特異度の他、陽性的中率、陰性的中率というものがあるそうです。

 

・ 感度(sensitivity)
 がん検診の場合にはある検査が、がんのある者を「陽性」と正しく判定する割合。下表の中、a/(a+b)の値である。感度が高いことは、検査法の見落としが少ないことを意味する。


・ 特異度(specificity)
 ある検査が、がんのない者を「陰性」と正しく判定する場合。下表の中、d/(c+d)の値である。特異度が高いことは、偽陽性が少ないことを意味し、有病率が低い疾患であるがんを対象とした検診の場合では、最も重要な指標である。

canscreen.ncc.go.jp

 

陽性的中率

陽性適中率とは、臨床検査における事後確率の1つで、ある検査において「陽性と判定された場合に、真の陽性である確率」として定義される値である。

ja.m.wikipedia.org

 

陰性適中率

臨床検査における事後確率の1つで、ある検査において「陰性と判定された場合に、真の陰性である確率」として定義される値である。

 なんのこっちゃという感じですが、かみ砕くと、

 感度    ・・・病気の人を病気と正しく言い当てられる確率

 特異度   ・・・病気でない人を病気でないと正しく言い当てられる確率

 陽性的中率 ・・・病気だと診断されたとき、本当に病気である確率

 陰性的中率 ・・・病気でないと診断されたとき、本当に病気でない確率

といった感じでしょうか。

 もう少しかみ砕くと、

 感度・特異度      ・・・医者から見た確率

 陽性的中率・陰性的中率 ・・・患者から見た確率

といった感じでしょうか。

 

 実際に、togetterのまとめと同じように、病気である確率が1%であることを前提として、スプレッドシートで計算してみました。


 まとめと同様に、病気の人に病気と判定できる確率、感度85%、病気でない人に病気でないと判定できる確率、特異度85%とすると病気と判定された人が実際に病気である確率、陽性的中率は5.4%と、えらく低い確率なりました。
 陽性的中率は、病気である確率1%にものすごく影響を受けるようですね・・・!

docs.google.com

 お次は感度90%、特異度90%で計算すると・・・、陽性的中率8.3%!
 90%って結構な確率だと思いますが・・・、それでも病気である確率1%の壁は厚いようです。

docs.google.com

じゃあどこまで行けば・・・!ということで感度99%、特異度99%に設定してようやく陽性的中率が50%!
まとめどおり、そもそも罹る人が少ない病気の場合、医者に病気であると言われたからといって、統計的には何の信ぴょう性もないことがわかりました。

docs.google.com

 

もちろん、多くの人がかかる病気であれば、高い感度・特異度は有効と思われます。

 

そこで感度・特異度ともに90%~100%の間で、病気の人がいる確率別にグラフを作成してみました。
それぞれ、1%、5%、20%で計算しました。

 

f:id:kj_man666:20200125121034p:plain

f:id:kj_man666:20200125121042p:plain

f:id:kj_man666:20200125121051p:plain

感度・特異度90%ってすごいレベルに感じますが、病気の人が20%でようやく75%の陽性的中率・・・!

病気の人が2割って腰痛(病気か?)とかのレべルでは・・・。

 

(2020/3/15 追記)コメント欄でNさんより、陽性尤度比の存在についてご指摘いただきました!ありがとうございます!

 陽性尤度比と呼ばれる、感度 ÷ (1 - 特異度)の算定により、非患者に対する患者の比がどの程度変化したかを表すことができるそうです!
 値が大きいほど検査が有用であるそうです!

 感度85%、特異度85%であれば、陽性尤度比 5.666...
 感度90%、特異度90%であれば、陽性尤度比 9
 感度95%、特異度95%であれば、陽性尤度比 19

bellcurve.jp

 

結論としては、お医者さんって大変だな、と強引にまとめます。

 

最後までお読みいただきありがとうございました!