相関と因果の違いは?相関係数の求め方とExcel関数

※記事の最後に、Excelの統計関数をまとめたスプレッドシートへのリンクを用意しました。よろしければご利用ください。

以前、国営放送のとある番組にて、「ひとり暮らしの40代が増えると日本は滅ぶ」という論理が話題となりました。この議論の行き着くところは「相関はあっても因果はない」に収束すると思われますが、この「相関」と「因果」を混同してしまうことで生まれる誤解は多いようです。

相関と因果の違いとは?

相関と因果の違いを簡単に述べると、

  • Aが “増える時” 、Bが増える。またその逆の関係にあるのが、相関。
  • Aが “増えたから” 、Bが増える。またその逆の関係にあるのが、因果。

です。でも統計学上で相関は出せても、因果関係を示すには様々な要因への立証が必要なため、かなり困難を要すると思われます。

AとBには、何らかの増減関係があるが、それぞれの因果関係を示すものではない、という理解が必要です。

相関係数とは?

因果はないにしろ相関はある、その度合を示すのが相関係数です。

前述で言うAとBの関係性の強さを-1から1の間で示します。1に近いほど「Aが増えるとBが増える」正の相関

-1に近いほど「Aが増えるとBが減る傾向」負の相関となります。

0に近いほど相関関係にはないとの事ですが、じゃあいくつからあるって言っていいの?という話は、様々な解釈があると思います。

ちなみにかなり昔にはなりますが、「Web担当者フォーラム」には、このような記事がありました。

相関関係と因果関係は別モノだ&Web担の解析データから相関係数表を大公開
http://web-tan.forum.impressrd.jp/e/2010/06/29/8282

AD

相関係数の算定式

相関係数は、下記のような計算式で求められます。

まぁ要は、xiに対するyiと、xとyそれぞれの平均値があれば出ます。

ちなみに相関係数Rを2乗した、「決定係数」で相関の強さを更に判別することもあります。エクセルで散布図を書いた時、近似曲線を表示させると出るRの2乗は、決定係数であり相関係数を2乗したものです。0から1の間を取ります。

エクセルで相関係数を出す

エクセルでは、PEARSON関数で出せます。

PEARSON(配列 1, 配列 2) Officeヘルプ

関数名は、ピアソンの積率相関係数に基いていることから来ています。配列1にxの値、配列2に、対するyの値を行か列で指定します。

また、相関係数を求める関数には、CORREL関数もあります。

CORREL(配列1, 配列2) Officeヘルプ

以前は計算手法に違いがあったようなのですが、現在はPEARSON関数と同じ値が出力されるようです。どちらか

Excel関数 – 統計関数一覧リンク

Excel関数の中でも、統計関数の説明や構文をスプレッドシートにまとめました。Excel 2010以降、統計関数は特により制度の高い関数へと変更になっていますのでご注意ください。

下記フォームにメールアドレスをご記入いただくと、スプレッドシートのURLへの遷移と記載したメールの送付をいたします。よろしければご利用ください。