どうすれば余剰発見(過剰診断)の割合が解るか、何がそれを妨げるのか

余剰発見とは

まずおさらい。余剰発見(過剰診断)は、

症状や死をもたらさない疾病を生前に発見する事

を指します。症状をもたらさないものを見つけるのだから、無症状の時に見つけるのが必要条件です。無症状時に疾病を見つけて対処する事を検診と言います。では、

検診で発見されたものの内、余剰発見の割合はどうしたら解るでしょうか。なるべく正確に把握するのを目指します。大まかには2つに分けられます。

余剰発見割合の測りかた

まず1つは、

検診群と非検診群でRCTをおこない、全員が死亡するまでフォローアップする

方法です。RCTは、各群を同質の集団にするような確率的操作です。そして、検診と非検診の群で比較します。そうして、発見割合の差を見れば、それが余剰発見と看做せます。

もう1つは、

検診をおこない、発見されたもの全てに対し、症状が出るまで処置をおこなわずに、全員が死亡するまでフォローアップする

やりかた。こうすれば、症状が出るまで処置を待つ事を全員におこなうので、他の原因で死ぬまで症状が出ない例を、完全に把握出来ます。

なお、ここでは簡単のため、全員が死亡するまでフォローアップが可能かとか、RCTでアドヒアランスが順守されるかとか、記録は正確に取れるか、などの点は措きます。

何が妨げるのか

方法としては、このような2つが考えられます。では、その実施を妨げる理由は何でしょうか。もちろんそれは、倫理的な理由です。

RCTでは、検診群と非検診群に分ける所に問題があります。一般に、介入と非介入とで群を分けて比較するのが許容されるのは、着目している疾病なりに対する有効な介入が知られていないといった、著しく知見に乏しい場合に限られます。しかるに検診では、既に効果の証拠があったり、観察研究において効果が乏しい事が確認されていたりします。ですから、いま検診でRCTがおこなわれるのは、既に有効性が示されている検診をおこなう群と、それに更に有効性を高めそうな介入を加えた群とを比較する、という方法が採られます(日本では、乳がん検診のJ-STARTや肺がん検診のJECS Studyなど)。したがって、成人に対する甲状腺がん検診のような、既に効果の小さい事が確かめられているものでRCTがおこなわれるとは、通常考えられません(小児に関しては、あらゆる証拠が足りない)。

いっぽう、検診群のみを設定し、それに対して、症状が出るまで一切の処置をおこなわない方法の問題は明白です。これは、症状が出るまで待つので、中には手遅れとなる症例が生ずる可能性があります。その症例においては、結果的に放置されたのを意味します。発見時にその疾病が症状をもたらすか、無症状時に処置すれば予後を良くするか、を決定するのは不可能なので、これは倫理的に許容されません。ちなみに、処置が予後を左右する時点の事をクリティカルポイント:臨界時点と呼びます。

甲状腺がん検診の研究では、発見後に無処置で経過観察する事(アクティブ・サーベイランス:積極的経過観察療法)が試みられましたが、これは症状が出るまで待つ訳ではありません。画像的に明らかなリンパ節転移や径の増大が認められたら、その時点で介入するものです。

ならどうやって調べるのか

乳がん検診や前立腺がん検診ではRCTがおこなわれ、それに基づいて余剰発見割合が推計されます。しかるに、それらにおいても、正確な推計がなされるのではありません。先に、フォローアップ等の実現可能性などの点は簡単のために省略すると言いましたが、既におこなわれたRCTに対しては、実際にそれらが効いてきます。全員が死ぬまでフォローアップするのは、コスト的にも仕組み的にも非現実的です。がんは発生率が小さいので対象数を多くとらないといけませんし、死ぬまでのフォローアップだから数十年が必要です。もし小児甲状腺がん検診を検討するとなると、80年くらいかかるかも知れません。また、アドヒアランス不良によるコンタミネーション(意図しないクロスオーバー)が起こるので、指標の比較も簡単ではありません。RCTでさえこのような困難な状況です。RCTが出来ない検診では、更に難しくなります。

まず考えられるのは、時系列的な検討です。つまり、通年の発見割合を眺め、もし検診しなければどのくらいの割合が見つかるか、を仮定してその差を評価する、といった具合です。こういう方法の弱点は、検診しない場合の発見割合(つまり有症状の割合)が仮定である事などです。RCTは各群を同質にする事を目論む方法ですが、時系列的な検討ではそのように出来ません。時間経過に伴って、着目していない様々の要因も動く可能性があるからです。環境要因や身体的変化が発生率を変化させるかも知れません。ですから、このような検討による証拠は一般に、間接的のものと捉えられます。

最近で盛んに用いられているのは、疾病の自然経過についてモデルを立て、マイクロシミュレーションを実施するものです。これは、自然経過、つまり、罹ってから症状が出るまでの期間等のモデルを設定し、生命表等から寿命などのデータを与え、実際に検診をやるものです。やると言っても、もちろんそれは、コンピュータープログラム上のものですが、各個人に対してそれをおこない、結果をデータベースに登録して集団の結果を表現出来る、という興味深い方法です。自然経過等のパラメーターは確率過程的(ストカスティック)な状態遷移を持つものです。

当然、この方法であっても、何らかの経験に基づくデータからパラメーターは設定されます。乳がん検診のモデルではRCTのデータが用いられる訳です。その観点からは、甲状腺がん検診のような、そもそも介入研究のデータに乏しいものは、モデルを立てる事そのものが難しいのです。だから、もしやるとしたら、様々のパターンを設定した多数のシナリオを用意して、このような結果が出ても実際と矛盾は無かろうといった、極めて消極的な主張に留めざるを得ないと思われます。余剰発見割合の推計というのは、まず倫理的な壁があり、更に実際的な問題があるので、難しいのです。

参考文献

ebm.bmj.com

www.ncbi.nlm.nih.gov

www.jstage.jst.go.jp

resources.cisnet.cancer.gov

www.statcan.gc.ca

www.e-epih.org

www.j-start.org

jecs-study.jp