日経グッデイ

病気にまつわる数字の話

“ピーチ病”にご用心

統計の仕組みを知って盲信は避けよう

 北澤 京子=医療ジャーナリスト

「5年生存率」「検査陽性」「基準値」「平均余命」「リスク」…。皆さんは、ニュースで見かける健康・医療関連の数字の意味を、正しく理解していますか? 病気にまつわる「数字」について、誤解しがちなポイントを分かりやすく解説するとともに、数字の読み方、解釈の仕方についても、わかりやすく説明します。

健康食品の広告などでこのようなグラフを見たことはありませんか。

 本連載で紹介しているような、病気にまつわる種々の数字の多くは、臨床研究で得られたものです。臨床研究では、大勢の人から得られたデータを統計解析して結果を出すことが多いのですが、そこでよく使われるのが「P値(ぴーち)」です。「p=◯◯◯」「p<△△△」と書かれたグラフや図を目にしたことがある人も多いと思います。

 P値のPとはProbability(確率)のこと。ある仮説が正しいとした場合に、観察されたデータ(またはそれより極端なデータ)が生じる確率を指します。P値は確率なので、「0(まったく起こらない)」から「1(必ず起こる)」の間のいずれかの値を取ります。

差がある、差がないはどうやって判定する?

 たとえば、ある病気の治療薬として、AとBの2種類があったとします。患者に使ってみたところ、有効だった割合は、Aでは70%、Bでは80%でした。一見すると、Bの方がAより効果が高そうですが、たまたまそうだっただけかもしれません。

 そこで検定を行います。検定では、AとBの効果に差がないと仮定(これを帰無仮説*という)した場合に、今回のようなデータ(A70%、B80%)が得られる確率(P値)を求めます(実際の計算方法については省略します)。

*帰無(きむ)仮説とは、比較する両群の間に関連性がないとする仮説のこと。両群間に関連性があることを証明したい場合に、まずは「関連性がない」という帰無仮説を置き、それを否定するというロジックが用いられる。

 もしP値が大きければ(1に近ければ)、「実は差がないのに偶然にこういうデータが得られる確率は高く、特にめずらしくない」と考え、AとBに差がないとした帰無仮説は正しいと判断します。逆に、P値がものすごく小さければ(0に近ければ)、「実は差がないのにこういうデータが得られる確率は低く、滅多にない」と考えます。そして、滅多にないのであれば、もともとの帰無仮説が間違っている、すなわち、AとBには差があると判断するのです。

 「差がある」ことを言うために、いったんは「差がない」としておいて、それを否定するというプロセスを踏むわけです。

科学的な結論はP値だけでは決められない

 臨床研究では、P値が0.05(5%)未満であれば帰無仮説が間違っているとして、AとBは「統計学的に有意な差がある」と表現することが多いです。薬の有効性を評価するための臨床試験などでよく見かける表現です。

 この「統計学的に有意な差」があるかどうかは、あたかも勝負を判定するリトマス試験紙のように扱われている実態があります。しかしこの点については、以前から批判がありました。

 P値が0.049なら0.05より小さいので「有意差あり⇒有効」と考え、P値が0.051なら0.05より大きいので「有意差なし⇒有効とはいえない⇒無効」と考えてよいかといえば、そんなわけはありません! P値は連続的な値なので、0.05を境にスパッと分かれるはずがないですし、0.05という値も、閾値として慣習的に使われている(だけの)値です。0.05とは、5%の誤差は受け入れるということですので、もしも閾値を0.06にすれば(6%の誤差は受け入れる)、0.049でも0.051でも「統計学的に有意な差」になりますし、閾値を0.04にすれば(4%の誤差は受け入れる)、いずれも「統計学的に有意な差」ではなくなってしまいます。

 こうした“P値信仰”ともいうべき風潮に関して、米国統計学会は2016年3月に声明を発表しました。これは、177年の歴史のある同学会で初めてのことだそうです(Nature. 2016;531:151.)。この中で、「科学的な結論、ならびにビジネスや政策上の判断は、P値が特定の閾値を超えるかどうかだけに基づいてなされてはならない」とはっきりと述べられています。

【米国統計学会のP値に関する声明:文脈、プロセス、目的(抜粋)】
  • (1)P値は、データが特定の統計モデルにどのくらい不適合かを表すことができる
  • (2)P値は、検討された仮説が真である確率、あるいは、データがランダムな偶然だけにより得られた確率を測っているわけではない
  • (3)科学的な結論、ならびにビジネスや政策上の判断は、P値が特定の閾値を超えるかどうかだけに基づいてなされてはならない
  • (4)正しい推論には、完全な報告および透明性が必要である
  • (5)P値あるいは統計学的有意性は、効果の大きさや結果の重要性を測っているわけではない
  • (6)P値だけでは、あるモデルや仮説に関する根拠(エビデンス)の良い基準にはならない

(出典:Ronald L. Wasserstein & Nicole A. Lazar (2016): The ASA's statement on p-values: context, process, and purpose, The American Statistician, DOI: 10.1080/00031305.2016.1154108)

 健康食品の広告に出てくるグラフなどで、P値そのもののほか、「統計学的な有意差」という表現が出てくることがあります。それを理由に、まるで鬼の首を取ったかのように食品の機能を強調していれば、きっと「ピーチ病」にかかっているのです。

北澤 京子(きたざわ きょうこ)
医療ジャーナリスト・京都薬科大学客員教授
北澤 京子(きたざわ きょうこ) 著書に『患者のための医療情報収集ガイド』(ちくま新書)、訳書に『病気の「数字」のウソを見抜く:医者に聞くべき10の質問』(日経BP社)など。(撮影:直江竜也)