NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

「子宮頸がん検診の感度が2.5%なわけないだろ問題」の続報

プレジデントオンラインに■血液と尿の検査だけで本当に「がん」を見つけられるのか…現役医師が指摘「複数がん早期発見検査」の落とし穴 検診としての有効性が証明されたものは一つもないを寄稿しました。その中で、『株式会社HIROTSUバイオサイエンス』のプレスリリースに言及し、子宮頸がんの感度が2.5%とされた問題について取り上げました。プレジデントオンラインの記事では、より多くの読者に理解していただくため複雑な計算を省略しましたが、ここでは補足としてその詳細を解説します。


子宮頸がん検診の感度が2.5%とするプレスリリース

「子宮頸がん検診の感度が2.5%なわけないだろ問題」とは、線虫によるがん検査『N-NOSE』を提供している『株式会社HIROTSUバイオサイエンス』による2024年9月27日付のプレスリリースのN-NOSEが既存検査よりも陽性的中率が圧倒的に高いことを示すために示した表において、子宮頸がんの感度が2.5%としてある問題のことである。


■線虫がん検査N-NOSEは新時代へ―実社会データの発表により終止符―(2024年9月27日)

2024年9月27日付株式会社HIROTSUバイオサイエンスプレスリリースより引用


感度とは、真に病気にかかっている人のうち検査で陽性の人の割合のことだ。子宮頸がん検診の感度は広く検証されており、報告によっても幅があるが、2.5%というきわめて低い報告は私の知る限りでは存在しない。たとえば、がん情報サービスのサイトには、「子宮頸部擦過細胞診のCIN3以上の病変に対する統合感度は、ASCUS以上を精密検査の対象とした場合65.8%」との記載がある。プレスリリースには「国立がん研究センターのがん登録・統計から算出した」とあるが、どのように算出したのかは提示されていない。また、子宮頸がん以外のがんについても、既知の感度とは整合しない点が認められる。

この問題についてはTAKESANさんがすでに考察しており、国立がん研究センターのがん登録・統計のプロセス指標におけるがん発見率を100倍したものが、プレスリリースの表における感度に近いことが指摘されている。



■HIROTSUバイオサイエンスの言う《感度》とは何か|TAKESAN



もちろん、発見率を100倍したものを感度とするのは誤りである。というか意味がわからない。株式会社HIROTSUバイオサイエンスが、感度とはどういうものかという疫学のごく基本すら理解していない誤りを犯したか、もしくは、多くの専門家が見落としていた大発見をしたかのどちらかだと思われる。


何の説明もなく子宮頸がんの感度が2.5%から6.7%に

その後、すでに配信されたものに一部加筆したとされるプレスリリースが2024年10月7日に公開された。10月7日付のプレスリリースでは、子宮頸がんの感度は6.7%とされている。また、「【要精検率、陽性的中率】を参照し算出」という語句が追加されている。



■「N-NOSE」は新時代へ ― 「N-NOSE」の有効性、実社会データで確定、論争に終止符 ―

2024年10月7日付株式会社HIROTSUバイオサイエンスプレスリリースより引用


他のがん種についても感度や陽性的中率が変更されている。仮に感度の算出過程に誤りがあったとしても、修正し、その旨を説明すれば大きな問題はないだろう。しかし、本プレスリリースにおいては、いったいなぜ変更されたのか、そもそも変更したという事実も説明されていない。

また、「【要精検率、陽性的中率】を参照し算出」とあるが、要精検率と陽性的中率だけからは感度は算出できない。感度は、真に病気にかかっている人の数を分母、そのうち検査で陽性の人の数を分子とすれば算出できる。要精検率と陽性的中率から検査で陽性の人の数はわかるが、真に病気にかかっている人の数はわからない。具体的な計算式を提示するなど、どのような方法で感度を算出したのかHIROTSUバイオサイエンスは説明すべきであると私は考える。

どのがんもなぜか有病割合が0.8%程度

TAKESANさんも指摘したように、9月27日付のプレスリリースの子宮頸がん検診の感度2.5%、特異度が97.9%、陽性適中度が1.2%という数字から、子宮頸がんの有病割合(時点保有割合)が1%程度である必要がある(表参照)。有病割合とは、ある時点において集団中における真に病気にかかっている人の割合のことである。

人口100000人、有病割合1%の集団に、感度2.5%、特異度が97.9%の検査を行った場合のシミュレーション


子宮頸がんだけでなく、肺がん、乳がん、大腸がん、胃がんも同じく有病割合が1%程度でないと、各指標を説明できない。当り前の話であるが、それぞれのがん種はそれぞれ有病割合が異なるので、何か重大な誤りが生じているとしか言いようがない。

10月7日付のプレスリリースの子宮頸がん検診の感度6.7%、特異度が97.9%、陽性適中度が2.5%という数字からは、子宮頸がんの有病割合は0.8%程度である必要がある。肺がん、乳がん、大腸がん、胃がんも同じく有病割合は0.8%程度だ。

先に述べたように要精検率と陽性的中率だけからは感度は算出できない。しかし、有病割合がわかれば、分母である真に病気にかかっている人の数もわかるので、感度は算出できる。ただ、正確な有病割合を知るのは難しい。精検を受けた人のうち真に病気にかかっている人の数はわかる。しかし、偽陰性例、つまり精検不要と判定されたが実際には病気にかかっていた人の数を数えるのは手間がかかる。検診で陰性であった人も含め全員を精密検査するか、検診で陰性だった人を追跡して一定期間中にがんと診断された人の数を数える必要がある(■がん検診の「見落とし」を数えるのは難しいを参照)。ちなみに先に挙げた「子宮頸部擦過細胞診のCIN3以上の病変に対する統合感度は、ASCUS以上を精密検査の対象とした場合65.8%」という数字は合計87000人以上の複数のコホート(追跡対象集団)を対象にして算出された。

そのような手間をかけずに、要精検率と陽性的中率に加えて独自に有病割合を適当に一律1%と定めて計算すれば、感度や陽性的中率のようなものは算出できる。当然であるが、集団によってもがん種によっても有病割合は異なるので、そうした算出方法は誤りである。また、「現実社会の一般がん罹患率が約0.8%」だからといって、有病割合を0.8%と定めるのも誤りである。罹患率(incidence rate)と有病割合(prevalence)が異なる指標であることは、どの疫学の教科書にも載っている基本的な事柄だ。


論文には子宮頸がんの感度が2.5%と書いているけど、どうするんだろ

いずれにせよ、10月7日時点においては、HIROTSUバイオサイエンスは、子宮頸がん検診の感度は2.5%ではないと認識していることになる。その場合、2024年9月に発表されたN-NOSEの性能を評価したとする論文*1に記載されている子宮頸がん検診の感度2.5%も誤りということになってしまうのではないか。

Hatakeyama et al., A non-invasive screening method using Caenorhabditis elegans for early detection of multiple cancer types: A prospective clinical study, Biochem Biophys Rep, 2024 Jul 13:39:101778.より引用


子宮頸がんほか、各がん検診の感度についての記載は、今後、訂正されるのかもしれない。もしそうなら、同時に、[as reported by the Japanese National Cancer Center Cancer Information Service “Cancer Registration/Statistics”. ]という部分も訂正されるのが望ましい。あたかも日本のがんセンターが、がん検診の感度についてデタラメな数字を報告しているような誤解を招くからだ。実際には、がんセンターが提供する「がん情報サービス」における要精検率、陽性的中率を参照して、論文筆者らが独自に算出した数字に過ぎない。私見を述べさせてもらうと、子宮頸がん検診の感度が2.5%という記載がすり抜けてしまうようでは、まともな査読は行われていないと考えざるを得ない。


「リンパ節転移があるから過剰診断ではない」は誤り

福島県において、事実上の甲状腺がん検診が続けられています。甲状腺がん検診は、がん死亡率の減少といった利益が明確ではない一方、偽陽性や過剰診断などの害があります。「過剰診断はすでに専門家らによって対策済み」という理由で過剰診断はほとんど起きていないと主張されることがありますが、誤りです。前回、■ジャガイモの水分と甲状腺がんの過剰診断にて、腫瘤径が小さく悪性を疑う所見を認めない場合は精密検査をしないといった方針で過剰診断は減るものの、それでもなお、甲状腺がんと診断された人における過剰診断の割合がかなり高いままということがありうることをご説明しました。

専門家らによる対策の一つに、甲状腺がんと診断してもリスクが低いと判断できる場合は直ちに手術しない「積極的経過観察(AS:active surveillance)」という方針があります。確かに手術と比べて害を減らすことはできますが、治療しないがんを抱え続けるという心理的不安や、長期にわたって検査を受け続ける必要性といった害は生じます。よって、ASという方針で過剰診断の問題が解決できるわけではありません。「絶対に手術をしないと取り決めるなら過剰診断による実害はゼロ」などという主張もありますが、がんと診断される心理的な不安について想像力が欠けています。

加えて、ASを勧められても不安から手術を選ぶ患者さんもいらっしゃいます。本来、検査を受けなければ甲状腺がんと診断されることもなく、手術を受けることもなかったはずなのに。害を上回る利益が検査にあるのなら、やむを得ない害と言えますが、すでに述べたようにがん死亡率の減少といった利益は確認されていません。「手術合併症リスクや治療に伴う副作用リスク、再発のリスクを低減する可能性」があるとも主張されていますが*1、そうした利益の存在は臨床的証拠によって示されていません。それどころか、ASを勧められたが手術を受けた症例の存在は、手術合併症リスクや治療に伴う副作用リスクを検査が逆に増やしうることを示唆しています。

福島県立医科大学の「専門家」は、ASを勧められたが手術を受けた症例の術後病理においてリンパ節転移や被膜浸潤が認められたことから、「過剰診断を裏付けるような術後病理結果は出ていない」と述べていますが*2、現在広く採用されている過剰診断の定義によれば、術後病理結果からは過剰診断かどうか判断できません*3。リンパ節転移や被膜浸潤があっても、一生涯症状が出なかったり、死亡の原因にならなかったりするものは、定義上、過剰診断です。

「リンパ節転移や被膜浸潤があるから過剰診断とは言えない」と主張するのであれば、韓国において実に15倍に増加した甲状腺がんの数十%にリンパ節転移や被膜浸潤が認められたこと*4、あるいは、ASの適応がある低リスク甲状腺がんでも即時手術を行うと30%弱にリンパ節転移が認められたという報告があることに*5、合理的な説明が必要が求められます。

甲状腺がんのASの確立に大きく貢献した隈病院のウェブサイト*6では、次のような説明がなされています。


最大径が1cm以下の甲状腺がんを「甲状腺微小がん」と呼びます。甲状腺の微小がんとは共存できるとしても、放置すれば転移の恐れがあるのではないか。これは当然の心配です。甲状腺がんの場合、微小がんであっても実際に手術をしてみると、顕微鏡で発見できるような微小がんのリンパ腺への転移が30~40%の患者から見つかります。ところが、このような転移した微細がんはほとんど成長せず、生命への影響が極めて小さいことも明らかになっています。

つまり、甲状腺の低リスク微小がんの場合は、がんそのものと共存できる場合がほとんどで、微小がんのリンパ腺への転移があったとしても、その転移したがんもほとんど成長せず、いずれの場合でも生命への影響が小さいことが明らかなのです。

「リンパ節転移や被膜浸潤があるから過剰診断ではない」という主張は世界標準の考え方と一致しません。私の把握している範囲内では、福島県立医科大学の「専門家」は、福島県で過剰診断がほとんど起きていないとする主張を英語論文として発表していません*7。一定の水準以上の医学雑誌では、「過剰診断を裏付けるような術後病理結果」といった標準的な過剰診断の定義を理解せずに記述された内容は査読を通らないでしょう。ガイドラインに従えば過剰診断や過剰治療を避けられるのであれば、苦労はありません。

「成長の早い子どもの甲状腺がんには当てはまらない」という反論が想定されますが、そのように反論する人にお尋ねします。成人と小児が異なるのであれば、現在の福島県において、成人の甲状腺がんの知見に基づいた抑制的な診断や経過観察が行われている現状をどうお考えですか?経過観察を勧められるも手術を希望された症例からも高い割合でリンパ節転移が認められているのですよ?小児の甲状腺がんの成長が早いのなら経過観察せずにすぐに手術すべきではないのですか?

私の観察範囲内では「小児の甲状腺がんは成長が早いので、成人の甲状腺がんの知見に基づいた抑制的な診断・治療は不適切だ」という意見は見当たりません。本当に福島県の子どもたちを案じているのであれば、「過剰診断ではない」という主張に都合の良い「専門家」の意見を鵜呑みにするのではなく、抑制的治療が勧められたケースで高い割合でリンパ節転移が確認されている現実に無頓着ではいられないはずだと、私は思うのですが。


ジャガイモの水分と甲状腺がんの過剰診断

ジャガイモのパラドクス

「ジャガイモのパラドクス」は直感に反する数学の問題の一つです*1。Wikipediaから引用し、和訳しました。計算すれば答えは出ますが、まずは直感で考えてみてください。


フレッドは100kgのジャガイモを家に持ち帰りました。このジャガイモは、99%が水分で構成されています。彼はそれを一晩外に置いておき、水分が98%になるまで乾かしました。このとき、乾かしたジャガイモの重さはどれくらいになるでしょうか?

実際のジャガイモの水分含有率は80%ぐらいだそうです。99%が水分とはずいぶんとみずみずしいジャガイモですが、「純粋に数学的なジャガイモ」だとみなしてください。あるいは、もっと水分含有量の多い別の食べ物に置き換えていただいてもかまいません。考え方の本質には影響しません。

答えは下のほうに。











計算自体は簡単です。100kgのジャガイモのうち、水分は99%ですので、固形部分は1%、つまり1kgです。乾かしたジャガイモの水分は98%、固形部分は2%になります。乾かしたジャガイモの重さをX kgとすると、X kg× 0.02 = 1 kgとなり、X = 1 ÷ 0.02 = 50 、50 kgとなります。

みなさん、計算結果は直感と反しましたか?水分はたった1%しか減っていないのに、全体の重さが50%も減るというのが直感に反するのだそうです。正直に言いますと、私は直感と反するとは感じられませんでした。似た問題をすでに知っていたからでしょう。


甲状腺がんの過剰診断のパラドクス

その問題とは、甲状腺がんにおける過剰診断の割合についてです。甲状腺がんは進行が遅く、治療をしなくても一生涯症状が出ない「過剰診断」が多いことが知られています。超音波検査等で発見された甲状腺腫瘤を片っ端から精密検査すると、多くの過剰診断が生じます。そこで、腫瘤径が小さく悪性を疑う所見を認めない場合は、精密検査をしないといった方針が現在では採用されています。この新しい診断方針で過剰診断は減ります。しかし、それでもなお、甲状腺がんと診断された人における過剰診断の割合がかなり高いままということがありうるのです。

直感的にはわかりにくく感じる人もいるようです。ジャガイモの場合と同じく、具体的な数字で考えてみれば、直感と計算結果が食い違うことがよりわかりやすくなるでしょう。


ある集団に対し甲状腺検査を行うと古い基準では100人の甲状腺がんが発見され、うち99%が過剰診断です。腫瘤径が小さく悪性を疑う所見を認めない腫瘤を除外するという新しい診断方針では、甲状腺がんと診断される人は50人に減りました。除外された50人すべて過剰診断だと仮定すると、甲状腺がんと診断された50人のうち、過剰診断の割合は何%になりますか?

甲状腺がんと診断される人が半分になったのだから、過剰診断の割合も99%から49.5%に半減した、なんて間違える人はいないことを願います。古い基準で甲状腺がんと診断された100人のうち過剰診断ではない人は1人です。新しい診断方針では甲状腺がんと診断される人は50人ですから、過剰診断の割合は(50-1) ÷ 50 = 98%です。甲状腺がんと診断される人を半分に減らしたのに、過剰診断の割合は1%しか減っていないのは直感に反すると感じる人もいるでしょう。

古い基準で診断された甲状腺がんのうちの過剰診断の割合や、新しい診断方針で除外できる人数は仮の数字を当てています。現実の甲状腺がんではどうでしょうか。たとえば、韓国の甲状腺がんにおいては、90~95%が過剰診断だったという推計があります*2。これは、症状を呈して診断される人も分母に含んでいますので、「無症状で検査を受けて甲状腺がんと診断された人における過剰診断の割合」はもっと高いはずですが、大雑把な推計には使えます。

新しい診断方針で甲状腺がんと診断されない人の割合は数十%はあります。これもいろいろ報告はありますが、たとえば、2000~2009年にソウル国立大学病院で手術を受けた甲状腺乳頭がんのうち、腫瘍径1 cm以下は約43%、リンパ節転移がない症例は約56%、甲状腺外進展がない症例は約45%でした*3。腫瘍径1 cm以下でリンパ節転移も甲状腺外進展もなければ、新しい診断方針では甲状腺がんと診断されない可能性が高いです。実際の臨床データに基づくと、新しい診断方針によって、おおむね、ざっと診断数を半分ぐらいにできたと考えられます。

さて、古い基準で90%が過剰診断、新しい診断方針で全体の診断数を半分にできたとして、過剰診断の割合はどれぐらいになりますか?45%ではないですよ。そう、80%です。細かい数字に納得できない人もいらっしゃるでしょうが、少なくとも割合の計算ができる人は、新しい診断方針で過剰診断は減るが、それでもなお、甲状腺がんと診断された人における過剰診断の割合がかなり高いままということがありうることには同意できるでしょう。

診断方針を、たとえば「腫瘤径1 cm以下は精査しない」から「腫瘤径2 cm以下は精査しない」に変更すれば、さらに過剰診断は減らせますが、今度は精査をしなかった集団から、将来、症状が生じる甲状腺がんが出てくる恐れがあります。現在の基準は「症状が生じる甲状腺がんにはほぼならないであろう」というものだけを除外する厳しい基準ですので、「おおむね大丈夫だろうけど症状が生じる甲状腺がんになるかもしれない」ぐらいの結節は精密検査されます。

乳がんや肺がんですら、検診で発見されたがんの15~30%は過剰診断です。無症状の集団を対象に甲状腺がんの検査をして、過剰診断がほとんど起きないなどありえません。「過剰診断はすでに専門家らによって対策済み」という理由で過剰診断はほとんど起きていないという主張は完全な誤りです。診断方針を変えるぐらいで過剰診断をほとんど抑制できるのであれば論文にして発表すべきです。

上記したことを踏まえて、福島県においては、「小児甲状腺がんは成人の甲状腺がんと異なる」という立場に立って過剰診断はほとんど起きていないという主張は論理的には可能です。しかしその場合、成人の甲状腺がんにおける知見を元にした過剰診断対策を小児に適用することの正当性が問われます。加えて、対象者が成人になった以降も甲状腺検査を続けることについての課題も残ります。

応用問題

■【仮タイトル】甲状腺がん - Togetter [トゥギャッター]より引用。

フェアな評価をしましょう

Masato Ida, PhDさんとの議論で出てきた数字です。甲状腺がんの過剰診断の割合は99.7~99.9%という「Welch ら(2010年)が挙げた大雑把な数字」を挙げています。甲状腺がんの人の数が1000人、本当に必要だった手術の数は1~3。診断基準(新しい診断方針)によって960人が手術を避けられ、40人が手術を受けます。さて、診断基準がある場合、手術を受けた人における過剰診断の割合は何%でしょうか?

Togetterのコメント欄でMasato Ida, PhDさんにお尋ねしましたが、お答えをいただけなかった上、ブロックされました。コメント欄を読んでいただければ、私とMasato Ida, PhDさんのどちらが正当なのかほとんどの人は理解できると思います。診断基準によって960人という多くの人が手術を避けることができてもなお手術を受けた人における過剰診断の割合が高いという事実が直感に反するがゆえの行為であると私は考えます。


*1:â– Potato paradox - Wikipedia

*2:PMID: 37488752

*3:PMID: 23427907