皆さんこんにちは、Partner of Medical Translatorsの津村です。

今日は、相関分析や回帰分析の結果の解釈で陥りやすい誤りについて、お話ししましょう。

問題となった記事

過日、以下の論文を翻訳しました。(原文はこちら

タイトル:Epidemiologic and Clinical Characteristics of Optic Neuritis in Japan

⇒ 日本における視神経炎の疫学的特徴及び臨床的特徴(Epidemiologic and Clinical Characteristicsの元の文はEpidemiologic Characteristic and Clinical Characteristicで、Characteristicが重複していますので、省略してCharacteristicsとしています

視神経炎(optic neuritis)は自己免疫疾患の一種で、発症後数日以降で視力低下を来たします。視野の中心部が暗くて見えにくいという症状や赤や緑を中心として色の識別が困難になったり、チラツキが出て視界を遮るなど、多種多様な症状を呈します。特に、抗アクアポリン4抗体陽性視神経炎では、失明に至る危険性が高いと言われています。

論文での記述

視神経炎の疫学研究自体の成果は適確に記述されている様でしたが、私が問題視したのは、論文中で述べられていた視力(VA:visual acuity)と年齢の関連性に関する記述です。

論文のMethodには次の様に解析方法が説明されています。

In addition, for all patients in the 3 groups, Spearman’s rank correlation was used to analyze the correlation between age and VA, and these were compared before and after treatment.

⇒ さらに、この3群の全被験者に関して、Spearmanの順位相関を年齢とVAの間の相関関係の解析に使用し、それらの結果を治療の前後で比較した。

ここで、3群とは抗アクアポリン4抗体陽性患者群(66例)、抗myelin oligodendrocyte glycoprotein抗体陽性患者群(54例)そして両抗体陰性群(410例)でした。

そして、その結果としての散布図と求めたパラメータが下図の様になっていました。

.png

Figure A. Scatterplots showing the relationship between age at onset and visual acuity analyzed by Spearman’s rank correlation. Both (A) pretreatment and (B) posttreatment visual acuity decreases significantly as age increases. CF . counting fingers; HM . hand movements; LPt.light perception; logMAR . logarithm of the minimum angle of resolution; LPe . no light perception.

⇒ 図A:Spearmanの順位相関分析による発症時年齢と視力の関連性を示す散布図。(A)治療前及び(B)治療後の視力は共に、加齢と共に有意に低下した。 CF:指数弁、HM:手動弁、LP+:光覚あり、logMAR:最小視覚の対数、LP-:光覚なし

図で、縦軸は視力の程度(LP-[3.5]は視力ゼロ、[0]は視力が1.0)、横軸は年齢で0歳~87歳を表しています。

ここで、指数弁などは視力の程度を表していて、「指数弁(眼前50cmあたりで黒地前に出した指の数を答える),手動弁(眼前で手を動かす),光覚弁(フラッシュライトの光を眼に送って明暗を識別)といい,明暗がわからない状態で視力を0とする。」だそうですが、いずれも視力が相当悪い状態を表しています。

さらにDiscussionのパートでは、この結果を次の様に考察しています。

Furthermore, when all patients were analyzed, a negative correlation was observed between age and VA both before and after treatment. However, the pretreatment distribution data do not show clearly that VA declines significantly as age increases. Although posttreatment visual recovery is apparently better in the second and third decades, there are no definite data indicating that patients beyond these age groups recover significantly.

⇒ さらに、全患者を対象に解析したところ、治療の前と後の両方で、年齢と視力の間に負の相関を認めた。しかし、治療前のデータ分布では加齢に伴って視力が有意に低下することを明確には示していなかった。治療後の視力回復は、見た目の上では10歳代と20歳代が良い様あるが、これらの年代を越えて大幅に改善した患者を示しているデータはない。

どうですか、以上に挙げた記述を見ますと、「視力と年齢の間には意味のある(有意な)負の相関関係がある」というように読み取れます。さらに、この関係が有意であるとしている根拠として、相関係数が有意(治療前:p=0.0032、治療後:p=<0.0001)であることを挙げています。

相関・回帰分析におけるこの様な解釈は、解析結果のmisreadingの典型なのです。

では、何処にmisreadingがあったのかを個別に説明していきましょう。

1

相関と回帰は似て非なるもの

相関(correlation)と回帰(regression)は、その解析結果が似ているため、混同されやすいのですが、その原理原則は全くことなっています。

相関は単なる関連傾向

相関とは変数XとYがどの様な関連傾向にあるのか・・・を調べる方法です。変数XとYの間に因果関係(Xが原因で、Yが結果)があるかどうかを問いません。

特に、単相間(simple correlation)は変数XとYが直線関係にあるかどうかを検討します(曲線関係は苦手です)。

例えば、身長と体重の関係をグラフにすると、図Bの様になります。

3 出典:https://japaneseclass.jp/img/散布図?page=1

図B:身長と体重の関係(散布図)

身長と体重の間には何らかの傾向がありそうですが、身長と体重の間に(身長が原因で体重が結果と言うような)因果関係はありません。総じて、身長が高ければ体重も重いだろう、逆に、体重が重ければ身長も高いだろう・・・という関連傾向を見るのが相関分析です。

相関分析ではまず最初に、変数XとYの散布図(図Bの様な)を作ります。その散布図をしみじみと眺めて、なんとなく傾向が掴めたら、次に、相関係数を求めます。

相関係数はrで表し、-1~+1の値をとります。Xが増えるとYも増える(右肩上がり)ならば相関係数はプラスとなり、逆に、Xが増えるとYは減る(右肩下がり)ならば相関係数はマイナスとなります。係数の絶対値が1に近いほど、散布図は直線的になり、ゼロに近いほど散布図は散らばっていき、r=0は「無相関」と呼び。XとYの関連性はない・・・ということになります(図C)。

4

出典:https://bellcurve.jp/statistics/course/20089.html

図C:様々な相関係数rの例

以上の様に、相関とは変数XとYの(因果関係を問わない)関連傾向を調べる事で、関連傾向の強さを相関係数r(通常はアルファベットの小文字)で表します。

回帰は因果関係の程度を調べる

回帰とは、説明変数Xが1単位変化した時に、応答変数Yがどの程度変化するのかを予測するための方法です。

従いまして、変数Xと変数Yの間に何らかの(直接的な)因果関係が予想される場合に使います。

例えば、総資産額と住居の床面積の関係とか、中東での原油価格と国内のガソリン単価の関係とか、自動車の車体重量と燃費の関係・・・などの場合が相当します。

例題として、自動車の車体重量と燃費の関係を取り上げてみましょう。

まずは、データを入力して散布図を描いてみましょう。横軸(log Wt)は自動車の車体重量の対数、縦軸(log mpg)は燃費(ガソリン1gあたりの走行メートル)の対数となります。

5

出典:https://qiita.com/sakaikosuke/items/75ba95337ccdb32e7cb1

図D:自動車の車体重量と燃費の関係(回帰)

ここで、図中の破線の直線は「回帰直線(regression line)」と呼ばれ、データから推定された関係式です。この式から、車体重量が1単位変化した時に燃費がどれだけ下がるか(反比例しています)が予測出来ます。

ここで、注意すべきポイントは、回帰分析では相関分析には出てこない「回帰直線」と言うものが使われ、この直線が重要な意味を持っているのです。

そして、この回帰直線のあてはまり度の良さ、即ち、精度を表すパラメータとして、回帰分析では寄与率(contribution rate)と言うものを求め、通常はR2(Rの二乗)で表します。この寄与率はまた、決定係数(coefficient of determination)とも呼ばれます。

寄与率を求める計算式は複雑ですが、計算した結果は、奇しくも、相関分析で求めた相関係数rの二乗と一致します。これがまた、相関と回帰を混同しやすい一因となっているのですが・・・。

寄与率R2は、0~1のいずれかの値を取ります。その意味するところは、「変数Yのバラツキの何パーセントが回帰直線で説明できるか」を示しています。

例えば、寄与率R2が0.6(60%)であった場合、変数Yのバラツキの60%は回帰直線で説明できるが、残りの40%は別の要因で変動している・・・と言うことです。即ち、寄与率R2が1に近いほど、変数Xを使った回帰直線による変数Yの推定精度が高い、ということを表しています。

以上の様に、回帰分析は変数Xから変数Yを推定するための回帰直線を求めるための手法で、求めた回帰直線のあてはまりの良さを寄与率R2で表したものなのです。

2

無相関の検定

話をもう一度、相関に戻しましょう。

相関分析では、求めた相関係数rについて「無相関の検定」というものを行います。

この検定の目的は、相関分析で求めたrが偶然に得られたものではなく、「元の母集団の相関係数rが0」という帰無仮説が棄却できるかどうかを調べているのです。

この検定のポイントは、

「元の母集団の相関係数rが=0か≠0かを見極めている」だけであって、求めたrが意味のある相関係数かどうかを検定しているのではない!

ということです。つまり、求めた相関係数rが=0.01であっても、データ数が多ければ無相関の検定で有意となることがあるのです。

従って、無相関の検定で有意となったならば、次のステップとして、求めた相関係数rが意味のある係数かどうかを、別の知識から判断する必要があります。

意味のある相関係数とは

では、どのくらいの相関係数が出れば、変数XとYの間には関連傾向があると言えるのでしょうか?

それは一概には言えません。例えば、臨床検査でA社とB社の検査機器で同じ項目を測定したときの相関係数は、トリプルナイン(r=0.999)以上が求められますが、疫学やヒトを対象とした臨床試験などではせいぜいr=0.5とか0.6がMaxと言えるでしょう。

例えば、ヒトを対象とした臨床試験などでは以下の図Eの様な区分がひとつの目安とされています。

相関係数 意味 表現方法
0 相関なし まったく相関はみられなかった。
0<| r |≦0.2 ほとんど相関なし ほとんど相関がみられなかった。
0.2<| r |≦0.4 低い相関あり 低い正(負)の相関が認められた。
0.4<| r |≦0.7 相関あり 正(負)の相関が認められた。
0.7<| r |<1.0 高い相関あり 高い正(負)の相関が認められた。
1.0 または-1.0 完全な相関 完全な正(負)の相関が認められた。

.jpg

図E:相関係数の目安

ヒトを対象とした臨床試験であっても、rの絶対値が0.3以上ないと、二つの因子の間に関連傾向があるとは言いがたいと私は思います。

回帰分析ではrの二乗が寄与率(決定係数)となりますが、r=0.3としますと、寄与率R2は0.09(9%)となり、縦軸のデータのバラツキのわずか9%しか直線関係では説明できず、残りの91%は別の要因に起因している訳ですから、お世辞にも「関連傾向がある」とは言いがたいのではないでしょうか。

4

論文記事の問題点

以上、相関分析と回帰分析の特徴と相違点を理解したところで、再度、論文記事の問題の図Aを見てみましょう。

Spearmanの順位相関分析を行った・・・と説明していますが、図Aには回帰直線が引かれ、脚注には回帰式(治療前:y=-0.002x+0.309、治療後:y=-0.010x+1.211)が示され、更に寄与率R2が(治療前:R2=0.0207、治療後:R2=0.1296)計算されています。

つまり、

  • 相関分析の散布図に回帰直線はありません。
  • R2は寄与率(又は決定係数)を表し、回帰直線のあてはまりの程度を示す指標ですが、相関分析では使いません。
  • Spearmanの順位相関分析では、回帰式や寄与率R2は計算されません。
  • 相関分析を行った・・・としていますが、関連傾向のパラメータである相関係数rが示されていません。

と言うことで、図Aは相関分析ではなく、回帰分析を行ったことを意味しています。従って、Spearmanの順位相関分析ではない、別の何らかの回帰分析を使っていたと考えられます。

また、「発症時年齢と視力の間には有意な相関関係がある」と述べていますが;

  • 相関分析における検定は「無相関の検定」であって、検定結果が有意となったとしてもそれは単に「母相関係数がゼロ(=無相関)ではない」と言うことを示しているに過ぎません。
  • 求めた相関係数rが意味を持っているかのどうかの目安は図Eなどから判断します。

図Aの相関係数rは、寄与率R2をルートで開けば求まります。計算してみますと、治療前がr=0.144、治療後がr=0.36となり、図Eから判定しますと、

  • 治療前(r=0.144)は殆ど相関なし
  • 治療後(r=0.36)は低い相関がある

となり、「発症時年齢と視力の間に相関がある」とは積極的に言えない状況と考えられます。

さらに、図Aに示された寄与率R2から回帰直線のあてはまりの程度を見てみますと、

  • 治療前(R2=0.0207)では、回帰直線によって全データのバラツキの2%しか説明できず、残りの98%は別の要因で変動していることになります。
  • 治療後(R2=0.1296)では、回帰直線によって全データのバラツキの13%しか説明できず、残りの87%は別の要因で変動していることになります。

と言うことで、これらの回帰直線のあてはまりは全くよろしくない・・・と言うことです。

 

以上の様に、相関と回帰は似て非なるものであり、それらの分析の結果の解釈には注意を要することを、事例をもって示してみました。

相関・回帰分析で最も重要な情報は散布図です。図Aを眺めて、皆さんは、「発症時年齢と視力の間に相関がある」と感じますか?

この感覚(直感)が一番大切な情報なのです! 統計解析はこの感覚(直感)を数値化しているにすぎません。

デハデハ