メンタルヘルスの領域における無作為化対照試験についてのメタ研究:1955~2020年の間における薬理学的介入と非薬理学的介入の比較

CAN J PSYCHIATRY, 68, 639-648, 2023 A Meta-Research of Randomized Controlled Trials in the Field of Mental Health: Comparing Pharmacological to Non-Pharmacological Interventions from 1955 to 2020. Chen, S., Lee, A., Wang, W.

背景と目的

1948年に導入された無作為化対照試験(RCT)は,医療やメンタルヘルスの領域,そしてエビデンスに基づく治療的介入において必要不可欠な役割を担っている。

このような科学の領域において,鍵となる問題は再現性である。他の科学的研究の例に漏れず,メンタルヘルスの領域は,再現性プロジェクト(Reproducibility Project:RP)に基づく再現性問題に直面している。RPは,100件の先行研究の再現性を270名の心理学者によって検証している。RPの報告によれば,いかなる追試でも再現効果の平均エフェクトサイズはオリジナル研究の半分程度しかなかった。

他の医療分野と比較して,メンタルヘルス領域におけるRCTは本質的により複雑な側面を持つ。たとえば,治療の転帰は基本的に治療者や臨床家,そして治療を受ける患者の行動に依存しているし,ほとんどの介入は,複数の領域における幅広い転帰がもたらされており,異なる文脈や状況に適応して変更する必要がある。これらの特徴から,メンタルヘルスの領域におけるRCTの使用が適切であるかどうかの議論が生じている。その一方で,メンタルヘルスの領域では,心理療法や行動療法,心理教育,社会療法,ケア過程などの非薬理学的な介入の研究が興隆してきている。

本研究では,薬理学的なRCT(ph-RCT)と,非薬理学的なRCT(nph-RCT)を比較し,研究の数,サンプルサイズの中央値,エフェクトサイズの中央値について時系列的な傾向を調査した。

方法

コクランデータベース(CDSR)から,系統的レビューとメタ解析のデータを取得した。対象とする研究の選択基準は,①「介入」レビューに分類されること,②精神医学またはメンタルヘルス領域の研究であること,③2021年12月31日までにCDSRで出版されたものであること,の3点とした。

収集データは,二つに分類した。ブランチ1では,選択基準に適うデータについて,Rを用いて,設計種別(RCT,非RCT),出版年,サンプルサイズ,種々の転帰の測定結果を収集した。ブランチ2では,2名の研究者が独立して手作業で,系統的レビューのレビュー水準のデータを収集した。ブランチ2では,①薬理学的研究か否か,あるいは両者か,②ICD-10を参照して,どのようなカテゴリーの精神障害がレビューの対象となっているか,を精査した。ICD-10では,精神障害は大別して11種類に分類されているが,本研究では頻度の低い疾患分類もあったため,RCTの対象となる疾患を,①統合失調症とその他の精神症状を伴う精神疾患,②気分障害,③神経症性・ストレス関連障害,④器質性精神障害,⑤上記以外,の五つに再分類した。データは,コクランIDを用いて連携した。

これらのデータについて,Rを用いて統計解析を行った。解析では,メンタルヘルスの研究の増減,RCTのタイプ,サンプルサイズの中央値,エフェクトサイズに着目した。また,今回のメタ研究の対象となった精神障害について,Pearsonの相関係数(r)を算出した。

結果

最終的に,6,652件のRCTのデータを収集した。メンタルヘルスに関するRCTの数は1995年から2020年にかけて指数関数的に増加していた。1965~1969年では,メンタルヘルスRCTではph-RCTがほとんど(89.6%)であった。2005~2009年では,nph-RCTが増加し(48.4%),nph-RCTの数は2015~2020年にph-RCTの数を上回っていた(約80%)。

サンプルサイズの中央値は,全体では61[四分位範囲(IQR)=36~131],ph-RCTでは61(IQR=37~145.75),nph-RCTでは60(IQR=33~121.25)であった。中央値は時間と共に変動し,過去60年にわたって全体的な増加傾向が観測された。ph-RCTとnph-RCTのサンプルサイズを経時的に比較すると,ph-RCTの方がnph-RCTよりも中央値が大きかった。

Pearsonのrで測定したエフェクトサイズの中央値は,RCT全体で0.18(IQR=0.08~0.34)であった。介入方法による比較では,nph-RCT(0.19,IQR=0.08~0.36)は,ph-RCT(0.16,IQR=0.07~0.32)に比べて,エフェクトサイズの中央値が大きかった。主要な精神障害の各カテゴリーにおいてもnph-RCTとph-RCTの間に差が認められた。nph-RCTの方がエフェクトサイズの中央値(Pearsonのr)が大きかったカテゴリーは,差が大きい順に,統合失調症,気分障害,神経症性・ストレス関連精神疾患であった。

265号(No.1)2024年4月11日公開

(舘又 祐治)

このウィンドウを閉じる際には、ブラウザの「閉じる」ボタンを押してください。