数字の読み方ガイド
当サイトの表に出てくる r・n・ラグ・過去レンジなどを正しく読むためのガイドです。ローソク足の見方やPERのような一般的な投資用語は扱いません(優れた解説が他に多数あるため)。ここにあるのは、統計と株価の「連動」を数字で疑うための最低限の道具だけです。
相関係数 r —— 連動の強さ
2つの系列がどれだけ同じ方向に動いたかを「-1〜+1」で表す数値(ピアソン相関係数)です。+1に近いほど同方向、-1に近いほど逆方向、0付近は無関係。当サイトは|r|≧0.4を「連動あり」の基準にしています(計算前に固定・結果を見て動かしません)。
月次の前年同月比どうしの相関では、0.4はかなり強い部類です。逆に0.9のような数字を見たら、まず計算方法を疑ってください——生の値同士で相関を取った「見せかけ」であることがほとんどです(下記参照)。
見せかけの相関 —— なぜ前年同月比に変換するのか
統計も株価も、長期では右肩上がりのトレンドを持ちます。トレンドを持つもの同士は、中身に関係がなくても相関係数が0.9近くになります。これが「見せかけの相関」です。例えば「アイスの売上」と「あらゆる株価」は生値ならほぼ必ず正の相関になりますが、意味はありません。
当サイトはこれを避けるため、両方を前年同月比(YoY%)に変換してから相関を計算します。トレンドを取り除き、「増減のリズムが合っているか」だけを測るためです。
n(サンプル数)—— その r は信用できるか
nは相関の計算に使った月数です。同じr=0.5でも、n=240とn=30ではまったく意味が違います。nが小さいほど、偶然でも大きなrが出やすくなるからです。
実例:当サイトは酒税統計×ビール株の初回検証でr=0.58〜0.71という数字を得ましたが、n=35しかなく、ラグを7通り試した中の最良値だったため「偶然でも出うる範囲」と判断し、掲載を保留しました。当サイトの格付けはこの考えに基づきます:
| 表示 | 意味 |
|---|---|
| 長期連動 | n≧120(10年以上)で基準を満たす。最も信頼できる区分 |
| 直近参考 | n<60の少標本。興味深いが偶然の可能性を排除できない参考値 |
ラグ —— 統計は株価より先か、同時か
「統計をXヶ月前にずらしたとき、株価と最も合うか」を調べた値です。当サイトはラグ0〜6ヶ月の7通りを計算し、最も強いものを表示します。
重要な経験則:これまでの検証では、最良ラグはほぼ常に「0ヶ月(同月)」でした。つまり統計は株価を「予言」するのではなく「同時に」動いており、統計の発表時点(翌月〜翌々月)には株価はとっくに動いた後です。統計の使い道は先回りではなく、どの銘柄が本当にその統計の世界で生きているかの選別にあります。
COVID除外 —— 異常期間の歪みを外す
2020〜2023年は多くの統計が前年比-99%〜+1000%級の異常値を取り、相関を大きく歪めます。当サイトは該当期間を除外した計算を併記し、除外しても残る相関だけを頑健とみなします。除外すると消える相関は「コロナの暴落と回復を2つの系列が偶然共有しただけ」の可能性が高いためです。
過去レンジ位置 —— 最新値は強いのか弱いのか
指標ボードの「過去レンジ 上からX%」は、最新の前年比が過去全期間の中で何番目に強いかの百分位です。「+5.9%」だけでは強いのか分からなくても、「上から20%」なら歴史的に強い部類だと一目で分かります。
相関≠因果、そして多重検定
最後に2つの注意。第一に、相関は因果関係を保証しません。過去に連動していたという記録であり、理由の証明でも将来の保証でもありません。第二に、当サイトのように多数のペアを検証するほど、偶然の相関が混ざる確率は上がります(多重検定の問題)。だからこそ「COVID除外でも残るか」「事業構造で説明がつくか」を併せて確認し、説明のつかない数字は採用しません。
本ガイドは当サイトの数字の読み方を説明するもので、投資助言ではありません。手法の全文は手法と運営方針をご覧ください。