相関と因果の違いを整理する
目次
変数間の関係
分類
南風原(2002)によると
(1) x が大きい人ほど、y も大きい【集団レベル】
→集団における相関関係(2) x が大きくなると、y も大きくなる【個人レベル】
→個人内の共変関係(個人レベルで一方の変数の値が変化すると、それに伴ってもう一方の値の変数も変化する)(3) x を大きくすると、y も大きくなる【個人レベル】
→処理ー効果関係(何らかの処理ないし操作によって、ある変化が生じる)(4) x が大きいから、y も大きい【個人レベル】
→因果関係(原因と結果の関係)
と分類することができる。
各関係性と研究のタイプ
南風原(2002)は次のように述べている。
・(1)の集団における相関関係を明らかにしたいのであれば、適当な集団を対象に、2つの変数の測定を行うだけで十分です。その結果を散布図に示し、相関係数や回帰直線を用いて、変数間の関係を記述すればよいのです。
・(2)の個人内の共変関係に関心があるのであれば、同一の個人について、2つの変数が時間的にどのように共変するかを観察していく必要があります。(以下略)
・以上の2通りの関係は、いわゆる調査研究によって調べることができますが、(3)の処理ー効果関係については、実験研究や実践研究の中で、実際に条件を操作して調べる必要があります。
・(4)の因果関係については、これを直接的にデータで示すのは困難であり、(3)の処理ー効果関係に基づいて、あるいは、場合によっては(1)や(2)の関係を根拠に「推論」していく性質のものです。仮に処理ー効果関係が明確にみられても、実際にはその処理は原因ではなく、その処理と同時に導入した別の条件が原因であることもあるので、「処理ー効果関係」=「因果関係」とするのは短絡的です。
・個人ごとに考えることのできる関係[(2)・(3)・(4)]は、その関係の様態が個人ごとに異なるものである可能性があります。それに対し、集団における相関関係は集団に対してひとつしかないわけですから、こうした関係のタイプを超えた推論が難しいことは明らかでしょう。
回帰分析をめぐって
一般に、独立変数から従属変数への因果関係が予想される場合には、回帰分析を用いて分析を行うことが多い。だが、回帰分析をしたからすぐに因果関係が推論されるわけではないことに注意したい。
重回帰分析を行うときの注意点(抜粋)
・因果関係といえるのか
○ 時間的、理論的に因果関係を仮定できるのか・疑似相関
○ 相関係数と標準偏回帰係数を比較した際、それらが同符号で、ともに有意な値をとっていれば、その相関関係は因果関係と認めることも可能となる(用いられた独立変数の範囲内で、であるが)。
○ それに対し、相関係数は有意であるにもかかわらず、標準偏回帰係数が0に近くなる場合がある。
○ そのような関係にある場合、その相関は疑似相関である可能性がある。・抑制変数
○ 重回帰分析を行うことにより、相関関係では分からなかった因果関係が見えてくる場合もある。
○ 相関係数がほぼ0であっても、標準偏回帰係数が有意になることがある。
○ 従属変数(基準変数)との相関が低いにもかかわらず、標準偏回帰係数が有意になり、単純相関では隠れていた因果関係が見えてくることがある。このような独立変数(説明変数)を抑制変数という。*標準偏回帰係数(β):各独立変数(説明変数)が従属変数(基準変数)に及ぼす影響の向きと大きさ
回帰分析についても、南風原(2002)の言葉を借りれば「因果関係に接近していく」ことのできる手法にすぎず、「因果関係を明らかにする決定的手法」ではないのである。
おまけ
疑似相関を扱ったサイトとして次のサイトを挙げておきたい(英語)。
引用文献
・南風原朝和. (2002). 心理統計学の基礎 統合的理解のために. 東京: 有斐閣アルマ. pp.72-76
・小塩真司 心理データ解析第6回(2)
因果関係を追い求めて
コホート研究をめぐって(一般向けの記事より)
同記事によると
コホート研究の定義は、一般的に「特定の要因の有無により選択した集団を追跡して予後を調べ、要因との関連性を明らかにする研究」となっています。
とあり、いわゆる「縦断研究」であることがわかる。
コホート研究(縦断研究)の最大の利点は、関連を調べようとしている二つの出来事の時間的な前後関係(順序)がわかるということです。一方、症例・対照研究では、関連を調べようとしている二つの出来事を同時に調べてしまうので、その時間的な前後関係がわかりません。
同記事でも指摘されているが、コホート研究ではこうした「時間的な前後関係」が明らかなため、因果関係を類推しやすくなる(確実な立証ではない)といえる。
杉浦(2011)の言葉を借りれば、「因果関係を明らかにできるという点においては一般にコホート研究や介入研究ほど信頼性の高い情報が得られる」といえるだろう。
疫学研究の結果の因果関係をめぐって
杉浦(2011)は、次のように述べている。
・疫学研究の重要な目的の1つは、結果(疾病)と原因(暴露要因)との因果関係を明らかにすることであるが、研究を行う上で、①偶然(chance)、②バイアス(bias)、③交絡(confounding)の要因が研究結果に影響を及ぼすことを十分に考慮しなくてはならない。
これらの3つの要因を本文中の言葉を使ってまとめておきたい。
・「偶然」とは測定値の確率変動が研究結果に及ぼす影響のこと。
・「バイアス」とは暴露要因と疾病との実際の関連性を過大または過小に評価したりして、誤った研究結果を導き出すこと。情報バイアス(思い出しバイアス・過剰診断バイアス等)と選択バイアス(対象集団の選択の問題等)に大別できる。
・「交絡」とは暴露要因と疾病との関連性が第3の要因によって過大・過小評価されてしまう現象。交絡要因を考慮する統計学的な方法としては層別化解析や多変量解析がある。これらの方法を用いて交絡要因の影響を取り除くことを補正(adjustment)という。
引用文献
・相関関係と因果関係の違いに注意:朝日新聞デジタル
・杉浦実. (2011). コホート研究と症例対照研究. 日本食品科学工学会誌, 58(12), 608-609.