はじめに次の2つのデータには、かなり強い相関があります。 ビールの売上アイスクリームの売上どちらも、夏に増えます。さらに別のデータを見てみると、アイスクリームの売上溺死事故の数にも同じように強い相関が見られます。実際に月別データを並べて計算すると、アイスクリーム消費量と溺死事故数には強い相関(相関係数 0.8以上)が見られます。ここで一瞬だけ考えてみてください。アイスクリーム売上 ↑溺死事故 ↑もしこの2つが同じタイミングで増えるなら、アイスクリーム↓溺死事故という関係があるのでしょうか。もちろん、そんなはずはありません。それでも私たちは、こう考えてしまいます。・同じタイミングで増えている・グラフの形が似ているこの2つが揃うと、脳は無意識に「関係がある(=原因がある)」と判断してしまいます。実際には、ただ同時に動いているだけでも、私たちはそこに因果を見出してしまいます。この記事では、実際の公開データを見ながら相関関係と因果関係の違いを「構造」と「人の認知」の両方から考えていきます。データを見ると、本当に一緒に増えているまず、溺死事故のデータを見てみます。溺死事故も、気温と同様に夏にピークを迎える季節パターンを持っています。次に、アイスクリームの消費量です。図:アイスクリーム販売量(季節推移)出典:日本アイスクリーム協会こちらも、夏にピークを迎える明確な季節パターンが見られます。データを月ごとに並べて見るとアイスクリーム売上 ↑(夏にピーク)溺死事故 ↑(夏にピーク)という非常によく似た季節パターンが見えてきます。ここで多くの人は、次のように考えてしまいます。アイスクリーム↓溺死事故しかし、この2つの間に直接の因果関係はありません。では、なぜこのような相関が生まれるのでしょうか。「アイスクリームが売れると、溺死事故が増える」という関係があるようにも見えます。実際、データだけを見ればそう解釈することもできてしまいます。しかし、この解釈には重大な問題があります。本当の原因は「別のところ」にあるここで重要なのが共通要因という考え方です。2つの現象が同時に起きているとき、実は両方を動かしている別の原因が存在することがあります。今回の場合、その要因は気温です。実際に、日本の月平均気温を見てみます。図:東京の月平均気温(2025年)出典:気象庁 気象データ※グラフは気温(℃)の月別平均をもとに作成このグラフを見ると夏 → 気温が高い冬 → 気温が低いというはっきりした季節変化があります。そしてここが重要です。この気温の動きと、アイスクリームの消費の動きは、ほぼ同じ形をしています。さらに、溺死事故も同じタイミングで増減します。つまり、3つのデータを並べると気温 ↑├ アイスクリーム売上 ↑└ 溺死事故 ↑という“同時に動いている構造”が見えてきます。ここで初めて、因果ではなく構造で理解できます。ビール ↔ アイス ↔ 溺死の関係はすべて「気温」という共通要因によって動いているという構造なのです。相関関係と因果関係ここで整理しておきたいのが相関関係と因果関係の違いです。相関関係とは2つのデータが同じ傾向で動くことを意味します。しかし相関関係≠因果関係です。つまり一緒に動いているからといって原因と結果とは限りません。今回の例では気温が複数の現象を同時に動かしているのです。見かけの相関をどう見抜くかでは、このような「見かけの相関」をどう見抜けばいいのでしょうか。方法はシンプルです。「その関係を一度、分解してみる」ことです。例えば今回であれば・季節ごとに分けて比較する・気温の影響を考えてデータを見るといった形で、本当に直接つながっているのかを切り分けます。もしこの操作によって関係が弱くなったり消えるなら、それは因果ではなく、共通要因による相関である可能性が高いと言えます。重要なのは関係をそのまま信じることではなく一度疑って、分解してみることです。「ビールが売れるとアイスも売れる」の正体ここで最初の話に戻ります。ビールが売れるとアイスクリームも売れるという現象も、実は同じ構造です。ビール ↑アイス ↑これはビール → アイスという関係ではありません。実際には気温 ↑├ ビール売上 ↑└ アイス売上 ↑という構造です。つまり、両方とも同じ要因によって動いているだけなのです。有名な「偽相関」の例このように、実際には関係がないのに強い相関が現れるケースは珍しくありません。統計の世界では、こうした関係を偽相関(Spurious Correlation)と呼びます。有名な例の1つに、次のデータがあります。マーガリン消費量↓アメリカ・メイン州の離婚率この2つのデータには、実際に非常に高い相関が観測されています。しかし当然ながらマーガリン → 離婚という因果関係があるわけではありません。偶然、同じ時期に似た動きをしていただけです。この例は少し極端ですが、データ分析では同じようなことが頻繁に起きます。動きが似ている↓原因がある(と解釈してしまう)と考えてしまうと、誤った解釈につながる可能性があります。今回のアイスクリーム売上 ↑溺死事故 ↑も同じです。背後には気温という共通要因があり、両方のデータを同時に動かしているだけなのです。ビジネスのデータでも同じことが起きるこの問題は、統計の教科書だけの話ではありません。ビジネスのデータ分析でも相関を因果と誤解するケースはよくあります。例えば広告費が増えた月は売上が高いというデータがあったとします。しかしその背景には・季節要因・キャンペーン・新商品の発売など、別の要因が存在している可能性があります。もし相関だけを見て広告費 → 売上と判断してしまうと、誤った意思決定につながるかもしれません。まとめデータは嘘をつきません。しかし、正しいデータでも、人は簡単に間違えます。2つのデータが似た動きをしているとき、私たちはそこに「意味」を見出してしまいます。しかしそれは、本当に原因なのでしょうか。それとも、ただ同じものに動かされているだけなのでしょうか。この問いを持てるかどうかで、データの見え方も、意思決定も大きく変わります。データの読み解きや意思決定設計でお悩みの方は、UDATAまでお気軽にご相談ください。実データに基づいた分析設計や、意思決定に直結するデータ活用をご支援しています。お問い合わせはこちら: https://udata.co.jp/contact