NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

無意味なサイコロがん検査の精度を高いと見せかける方法

一滴の血液や尿で多くの種類のがんの検査ができると称する「がんリスク検査」が数千円から数万円程度で提供されています。無症状の人を対象とした検診において、がん死亡率を下げるといった有効性があるかどうかや、検診を受ける集団における感度や特異度がどれぐらいかは、明確になっていません。一部の検査については本格的な研究が国内外で進められていますが、まともな研究者は有償で検査を提供したりはしません。

架空の「サイコロ検査」

まったく仮定の話で、現実に行うつもりは一切ありませんが、私もそうした検査を提供するビジネスマンを演じてみましょう。私が提供する検査は、なんと血液も尿も必要ありません。代わりにサイコロを使います。合併症の可能性はゼロ。素敵ですね。1回1000円で値段も良心的です。陽性があまりに多いと不自然なので、20面体のサイコロを使い、ランダムに5%を陽性、95%が陰性という結果を返すことにしましょう。がんの患者さんを正しく陽性と判定する割合を感度、がんではない人を正しく陰性と判定する割合を特異度と呼びますが、この「サイコロ検査」の感度は5%、特異度は95%です。何の情報ももたらさない無意味な検査です。

20面体サイコロ

ところがですね、陽性と判定された5%の中に、たまたま、精密検査で早期がんが発見される人も一定割合でいるのです。そういう人は「サイコロ検査のおかげで命が助かった」と信じてくれます。そうした体験談を集めて、魅力的なウェブサイトで紹介すれば、サイコロ検査が有用だと勘違いしてくれる人も出てくるでしょう。本当はがんなのに陰性という結果を返す偽陰性もあるので、「あくまでもリスク検査であり、精度は100%ではありません。定期検診や通常のがん検診を並行して受けましょう」と言っておくことを忘れずに。

サイコロ検査を受ける人が多くなってくると、「サイコロ検査の陽性者を精密検査しても、それほどがんは見つからない。精度に問題があるのでは?」と、他の医療者から疑われるでしょう。なんなら、サイコロ検査陽性者を対象にどれぐらいがんが見つかるか、研究されるかもしれません。でも大丈夫。言い訳の方法は考えています。

ランダムなサイコロ検査でも、不適切な比較によって既存検査よりも精度が高いと言い張れる

部位は特定できないが全身のどこかにがんがあるかもしれないというときに、まず考慮される検査はPET検査でしょう。放射性物質を負荷したブドウ糖を注射し、細胞に取り込まれたブドウ糖の分布を画像にする検査です。過去の研究では、無症状の人がPET検査に加え、上部消化管内視鏡や腹部超音波や骨盤MRIなど一連の総合検診および追跡調査を受けたところ、受験者2911名中、157個のがんが見つかり、PETで発見されたがんはそのうち28個でした*1。

PETによるがんの発見率は28 ÷ 2911 = 0.96%です。サイコロ検査陽性者の集団を対象にPET検査を行っても、それぐらいの数字が出ます。検査陽性者のうち本当にがんである人の割合を、陽性的中率(陽性反応的中割合)と言います。「サイコロ検査で陽性と判定されたことで、担癌状態を疑ってPETがん検診を受診した場合のPET検診における陽性的中率は1%弱である。サイコロ検査陽性判定は直接的な担癌状態を意味するものとは言い難い」などと批判されるかもしれません。

批判に対する言い訳のポイントは「PET検診ではがんの見落としが発生するため、サイコロ検査の『真の陽性的中率』はもっと高い」「従来のがん検診と比べてサイコロ検査の陽性的中率は高い」の二つです。先のPET検査の研究では、PET検査の感度は28 ÷ 157 = 17.8%でした。実際、前立腺がんや肝細胞がんはPET検査で陰性になりやすいことが知られています。本当はがんなのにPET検査で見落とした分を補正すると、「真の陽性的中率」は0.96% ÷ 17.8% = 5.4%になると反論しましょう。

「真の陽性的中率」を持ち出して誤解させる仕組み

これは受験者におけるがん患者の割合(有病割合)、157 ÷ 2911 = 5.4%と同じ数値です。サイコロ検査は無意味な検査ですので、陽性的中率と対象集団の有病割合が同じになるのは当然です。有病割合5.4%は高いように思われるかもしれませんが、かなり先にならないと症状が出なかったり、あるいは一生涯症状が出なかったりするがん(過剰診断)まで徹底的に調べればそれぐらいの数字はあり得ます。そう考えれば「真の陽性的中率」が5.4%であるのはぜんぜん大したことはないのですが、従来のがん検診の陽性的中率と比較してみせることで、サイコロ検査の精度が高いと誤解させることができます。

たとえば、厚生労働省が推奨している大腸がん検診の陽性的中率は3.05%です*2。サイコロ検査の「真の陽性的中率」は5.4%ですので、自信を持って「第三者機関による発表結果は、サイコロ検査の陽性的中率が既存検査よりも高く、世の中で使っても高精度であるというものでした」とプレスリリースを打ちましょう。

いったいなぜ、ランダムなサイコロ検査のほうが、現実の大腸がん検診よりも高い陽性的中率だったのでしょうか?疫学に詳しい方なら、陽性的中率は、感度や特異度だけではなく、有病割合にも影響を受けることをご存じでしょう。対象集団の有病割合が大きいと陽性的中率は高く、逆に有病割合が小さい集団では陽性的中率は低くなります。大腸がんの有病割合は、全がんの有病割合よりもずっと低いので、大腸がん検診の陽性的中率は低く出ます。異なる有病割合の集団間で陽性的中率を比べても検査精度の良し悪しはわかりません。2つの検査の精度を比較したいときには、同じ集団、同じ疾病を対象にした研究を行う必要があるのですが、お金を儲けることが目的ならわざわざそんな研究はしません。不適切な比較を行ってサイコロ検査の精度がよいように見せかけるだけで十分です。

現実のがんリスク検査も実用性は証明されていない

現実のがんリスク検査は、サイコロ検査のように完全にランダムというわけではありません。よって、「真の陽性的中率」は、サイコロ検査の5.4%よりいい数字が出てもおかしくはありません。しかし、実社会で役立つためには、「サイコロよりマシ」ではまったく不十分で、一定程度の精度は必要です。例えば仮に、感度20%、特異度95%の検査があったとしましょう。感度20%だと、がん患者の8割を見落とします。低い感度をカバーするために検査を繰り返すと、コストはかさむし偽陽性も増えます。がんリスク検査は、1回数千円とコストが高く、偽陽性だと全身の精密検査が必要になります*3。感度20%の全身のがんリスク検査は、実用性はまったくないポンコツな検査と言えます。

有病割合5.4%の集団にポンコツ検査を行うと、「真の陽性的中率」は18.6%、PET検査の研究でも陽性的中率は3.3%ぐらいになります*4。がんの8割を見落とした上で、陽性でも8割以上が偽陽性の検査を受けたいですか?

既存のがん検診も、陽性的中率は数%程度と高くはありません。しかし、がんリスク検査のように陽性だったときに全身の精密検査は必要ありませんし、何よりも、推奨されているがん検診は検診によってがん死亡率が減少するというエビデンスがあります。一方で、がんリスク検査にはそのようなエビデンスはありません。検査が有用であるかのように誤解させるテクニックに騙されると、お金だけならまだしも、偽陽性のために多くの検査を受ける羽目になりかねません。あなたの健康と命を守る選択を、広告に惑わされず、賢明に行ってください。

*1:Evaluation of whole-body cancer screening using 18F-2-deoxy-2-fluoro-D-glucose positron emission tomography: a preliminary report URL:https://pubmed.ncbi.nlm.nih.gov/18600415/

*2:2020年、全国、男女計、全年齢、https://ganjoho.jp/reg_stat/statistics/stat/screening/dl_screening.html#03

*3:コストが安い便潜血検査は繰り替えすことができるし、PET検診の偽陽性の弊害はがんリスク検査と比べれば相対的には小さい。PET検診ががん死亡率を減らすというエビデンスは乏しく私は推奨しないが、それはそれとして

*4:有病割合5.4%の10万人の集団が感度20%、特異度95%の検査を受けたとする。疾患ありは5400人、うち検査陽性は1080人、検査陰性は4320人。疾患なしは9万4600人、うち検査陽性は4730人、検査陰性は8万9870人。検査陽性者は1080+4730=5810人。陽性的中率は1080÷5810=18.6%。感度17.8%のPET検査をGold standardとすると、「見かけの陽性的中率」は18.6%×17.8%=3.3%ぐらい。PET検査の偽陽性の分は誤差として無視する

喉の痛みにハチミツは効くか?

この記事の要約。

・ハチミツが咳に効くというエビデンスはわりとある。
・ハチミツが喉の痛みに効くかどうかはエビデンス不足。
・ハチミツを含む民間療法を普通の風邪に使用するのは悪くないと個人的には考える。
・ハチミツは1歳未満の乳児には禁忌。乳児ボツリヌス症のリスクがあるため。


大根のハチミツ漬けが喉によいという話が話題に

「はちみつにダイコンを漬けたものが喉によい」という話題がSNSで注目されている。もとのポストは現時点で2.8万リポスト、関連する反応を集めた■「ダイコンをハチミツで漬けると喉によい」と聞くが民間療法に頼るのは文明人じゃないと考えた…だが臨床試験をしたら劇的に効いた話 - Togetter [トゥギャッター]は180以上のブックマークを集めている。

言うまでもないが、述べられているのはn=1の体験談であって臨床試験ではない。


ハチミツは咳をやわらげるようだ

ハチミツが急性咳嗽に効くというエビデンスはわりとある。急性咳嗽とは3週間以内の咳のことで、普通の風邪を引いたときの咳と思っていただければよい。複数のランダム化比較試験が行われているし、系統的レビューもある。たとえば以下は、1歳以上の小児を対象としたランダム化比較試験10件を対象とした系統的レビューである。


â– Honey for acute cough in children - a systematic review - PubMed


ハチミツは、プラセボ/無治療や咳止め薬と比較して、咳の頻度の減少や睡眠の質の改善をもたらすようである。「ようである」と歯切れが悪いのは、参照した研究にはランダム化のプロセスの不備や介入からの逸脱といったバイアスがあることと、ハチミツの効果が示されなかった臨床試験もあることからだ。ハチミツは一般的な処方薬のように成分が規格化されているわけではないので、使用するハチミツの種類によって効果がばらつくのかもしれない。

とはいえ、とくに小児に対しては鎮咳薬が使いにくいこともあって、いくつかのガイドラインではハチミツが推奨されている。ただし、乳児の腸内細菌は未発達であり乳児ボツリヌス症のリスクがあるため1歳未満の乳児にハチミツを与えてはいけない。用量・用法に決まったものはないが、小児に対しては就寝前に2.5mL投与が目安とされている。投与後に歯を磨いたほうだいいだろう。

ハチミツの喉の痛みに対する効果はエビデンスに乏しい

ハチミツの咳に対する効果には一定のエビデンスがあるが、元のポストは咳ではなく喉への効果を論じている。ハチミツの喉の痛みに対する効果について調べてみたがあまりはっきりしない。上気道感染症の症状緩和に対する蜂蜜の有効性についての系統的レビューおよびメタ解析*1から孫引きで2017年の"Role of honey as adjuvant therapy in patients with sore throat"(喉の痛みを訴える患者における補助療法としてのハチミツの役割)という論文を見つけた。医学論文を検索する代表的なデータベースのPubMedでは検索できない。喉の痛みを訴える成人患者200名を対象として、介入群100名には抗菌薬を含む標準ケア+1日2回大さじ1杯のハチミツ、対照群100名にはハチミツを除く同じ薬剤を投与したところ、介入群では、対照群と比較して喉の痛みの症状の緩和が早く、患者の満足度も高いとサマリーにはある。ただし、有意差はなさそう*2。有意差検定をせずに"Honey is effective…“(ハチミツは効果的)などと要約に書いても掲載してもらえるぐらいの雑誌なのであろう。なお、大根については、咳、喉の痛みの両方について、文献を発見できなかった。

エビデンスに乏しくても効果があると思えば使ってもよい

たとえエビデンスに乏しくても、喉の痛みといった軽度の上気道症状に対し、ハチミツ、あるいは、大根のハチミツ漬けといったハチミツを含む民間療法を使用するのは選択肢の一つである。安価で安全であるのがよい。もしかしたらプラセボ効果しかないかもしれないが、そうだとしても、それで症状が緩和されるのであればよいではないか。すぐに病院を受診するよりもまず民間療法を試すほうが理にかなっているとも言える。普通の風邪は、薬を使っても使わなくても、自然に治る。病院に受診していただいても対症療法ぐらいしかできない。それもすごく効果があるわけではなく、ないよりましという程度であり、まれではあるが副作用も生じうる。病院を受診するための時間やお金、受診中にほかの感染症をうつされるリスク等も考慮すると、普通の風邪で病院を受診する必要はない。もちろん、普通の風邪でないかもしれないという懸念があったり、症状が重かったり長引いたりすれば病院を受診していただきたい。


*1:â– Effectiveness of honey for symptomatic relief in upper respiratory tract infections: a systematic review and meta-analysis - PubMed

*2:系統的レビューおよびメタ解析では喉の痛みに対するオッズ比は0.75、95%CI 0.43 to 1.32とあった。1をまたいでおり有意差はない

「子宮頸がん検診の感度が2.5%なわけないだろ問題」の続報

プレジデントオンラインに■血液と尿の検査だけで本当に「がん」を見つけられるのか…現役医師が指摘「複数がん早期発見検査」の落とし穴 検診としての有効性が証明されたものは一つもないを寄稿しました。その中で、『株式会社HIROTSUバイオサイエンス』のプレスリリースに言及し、子宮頸がんの感度が2.5%とされた問題について取り上げました。プレジデントオンラインの記事では、より多くの読者に理解していただくため複雑な計算を省略しましたが、ここでは補足としてその詳細を解説します。


子宮頸がん検診の感度が2.5%とするプレスリリース

「子宮頸がん検診の感度が2.5%なわけないだろ問題」とは、線虫によるがん検査『N-NOSE』を提供している『株式会社HIROTSUバイオサイエンス』による2024年9月27日付のプレスリリースのN-NOSEが既存検査よりも陽性的中率が圧倒的に高いことを示すために示した表において、子宮頸がんの感度が2.5%としてある問題のことである。


■線虫がん検査N-NOSEは新時代へ―実社会データの発表により終止符―(2024年9月27日)

2024年9月27日付株式会社HIROTSUバイオサイエンスプレスリリースより引用


感度とは、真に病気にかかっている人のうち検査で陽性の人の割合のことだ。子宮頸がん検診の感度は広く検証されており、報告によっても幅があるが、2.5%というきわめて低い報告は私の知る限りでは存在しない。たとえば、がん情報サービスのサイトには、「子宮頸部擦過細胞診のCIN3以上の病変に対する統合感度は、ASCUS以上を精密検査の対象とした場合65.8%」との記載がある。プレスリリースには「国立がん研究センターのがん登録・統計から算出した」とあるが、どのように算出したのかは提示されていない。また、子宮頸がん以外のがんについても、既知の感度とは整合しない点が認められる。

この問題についてはTAKESANさんがすでに考察しており、国立がん研究センターのがん登録・統計のプロセス指標におけるがん発見率を100倍したものが、プレスリリースの表における感度に近いことが指摘されている。



■HIROTSUバイオサイエンスの言う《感度》とは何か|TAKESAN



もちろん、発見率を100倍したものを感度とするのは誤りである。というか意味がわからない。株式会社HIROTSUバイオサイエンスが、感度とはどういうものかという疫学のごく基本すら理解していない誤りを犯したか、もしくは、多くの専門家が見落としていた大発見をしたかのどちらかだと思われる。


何の説明もなく子宮頸がんの感度が2.5%から6.7%に

その後、すでに配信されたものに一部加筆したとされるプレスリリースが2024年10月7日に公開された。10月7日付のプレスリリースでは、子宮頸がんの感度は6.7%とされている。また、「【要精検率、陽性的中率】を参照し算出」という語句が追加されている。



■「N-NOSE」は新時代へ ― 「N-NOSE」の有効性、実社会データで確定、論争に終止符 ―

2024年10月7日付株式会社HIROTSUバイオサイエンスプレスリリースより引用


他のがん種についても感度や陽性的中率が変更されている。仮に感度の算出過程に誤りがあったとしても、修正し、その旨を説明すれば大きな問題はないだろう。しかし、本プレスリリースにおいては、いったいなぜ変更されたのか、そもそも変更したという事実も説明されていない。

また、「【要精検率、陽性的中率】を参照し算出」とあるが、要精検率と陽性的中率だけからは感度は算出できない。感度は、真に病気にかかっている人の数を分母、そのうち検査で陽性の人の数を分子とすれば算出できる。要精検率と陽性的中率から検査で陽性の人の数はわかるが、真に病気にかかっている人の数はわからない。具体的な計算式を提示するなど、どのような方法で感度を算出したのかHIROTSUバイオサイエンスは説明すべきであると私は考える。

どのがんもなぜか有病割合が0.8%程度

TAKESANさんも指摘したように、9月27日付のプレスリリースの子宮頸がん検診の感度2.5%、特異度が97.9%、陽性適中度が1.2%という数字から、子宮頸がんの有病割合(時点保有割合)が1%程度である必要がある(表参照)。有病割合とは、ある時点において集団中における真に病気にかかっている人の割合のことである。

人口100000人、有病割合1%の集団に、感度2.5%、特異度が97.9%の検査を行った場合のシミュレーション


子宮頸がんだけでなく、肺がん、乳がん、大腸がん、胃がんも同じく有病割合が1%程度でないと、各指標を説明できない。当り前の話であるが、それぞれのがん種はそれぞれ有病割合が異なるので、何か重大な誤りが生じているとしか言いようがない。

10月7日付のプレスリリースの子宮頸がん検診の感度6.7%、特異度が97.9%、陽性適中度が2.5%という数字からは、子宮頸がんの有病割合は0.8%程度である必要がある。肺がん、乳がん、大腸がん、胃がんも同じく有病割合は0.8%程度だ。

先に述べたように要精検率と陽性的中率だけからは感度は算出できない。しかし、有病割合がわかれば、分母である真に病気にかかっている人の数もわかるので、感度は算出できる。ただ、正確な有病割合を知るのは難しい。精検を受けた人のうち真に病気にかかっている人の数はわかる。しかし、偽陰性例、つまり精検不要と判定されたが実際には病気にかかっていた人の数を数えるのは手間がかかる。検診で陰性であった人も含め全員を精密検査するか、検診で陰性だった人を追跡して一定期間中にがんと診断された人の数を数える必要がある(■がん検診の「見落とし」を数えるのは難しいを参照)。ちなみに先に挙げた「子宮頸部擦過細胞診のCIN3以上の病変に対する統合感度は、ASCUS以上を精密検査の対象とした場合65.8%」という数字は合計87000人以上の複数のコホート(追跡対象集団)を対象にして算出された。

そのような手間をかけずに、要精検率と陽性的中率に加えて独自に有病割合を適当に一律1%と定めて計算すれば、感度や陽性的中率のようなものは算出できる。当然であるが、集団によってもがん種によっても有病割合は異なるので、そうした算出方法は誤りである。また、「現実社会の一般がん罹患率が約0.8%」だからといって、有病割合を0.8%と定めるのも誤りである。罹患率(incidence rate)と有病割合(prevalence)が異なる指標であることは、どの疫学の教科書にも載っている基本的な事柄だ。


論文には子宮頸がんの感度が2.5%と書いているけど、どうするんだろ

いずれにせよ、10月7日時点においては、HIROTSUバイオサイエンスは、子宮頸がん検診の感度は2.5%ではないと認識していることになる。その場合、2024年9月に発表されたN-NOSEの性能を評価したとする論文*1に記載されている子宮頸がん検診の感度2.5%も誤りということになってしまうのではないか。

Hatakeyama et al., A non-invasive screening method using Caenorhabditis elegans for early detection of multiple cancer types: A prospective clinical study, Biochem Biophys Rep, 2024 Jul 13:39:101778.より引用


子宮頸がんほか、各がん検診の感度についての記載は、今後、訂正されるのかもしれない。もしそうなら、同時に、[as reported by the Japanese National Cancer Center Cancer Information Service “Cancer Registration/Statistics”. ]という部分も訂正されるのが望ましい。あたかも日本のがんセンターが、がん検診の感度についてデタラメな数字を報告しているような誤解を招くからだ。実際には、がんセンターが提供する「がん情報サービス」における要精検率、陽性的中率を参照して、論文筆者らが独自に算出した数字に過ぎない。私見を述べさせてもらうと、子宮頸がん検診の感度が2.5%という記載がすり抜けてしまうようでは、まともな査読は行われていないと考えざるを得ない。