ピアソンの積率相関係数の基本的な性質について理解する問題です。
相関係数の定義と範囲
ピアソンの相関係数rは以下の公式で定義されます:
$r = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n}(x_i - \bar{x})^2 \sum_{i=1}^{n}(y_i - \bar{y})^2}}$
取りうる値の範囲: $-1 \leq r \leq 1$
各値の意味
r = 1(完全正相関):
- すべてのデータ点が正の傾きを持つ直線上に完全に乗る
- Xが増加するとYも完全に比例して増加
- 例:y = 2x + 3のような関係
r = -1(完全負相関):
- すべてのデータ点が負の傾きを持つ直線上に完全に乗る
- Xが増加するとYは完全に比例して減少
- 例:y = -3x + 10のような関係
r = 0(無相関):
- 線形関係がない、または非常に弱い
- 注意:非線形関係は存在する可能性がある
- 例:y = x²のような放物線関係では原点対称なら r ≈ 0
0 < |r| < 1(部分相関):
- |r|が1に近いほど強い線形関係
- 一般的な目安:|r| ≥ 0.7で強い相関、0.3 ≤ |r| < 0.7で中程度、|r| < 0.3で弱い
相関係数の性質
- 無次元性: データの単位に依存しない
- 線形関係の指標: 非線形関係は適切に捉えられない
- 外れ値への感受性: 1つの外れ値で大きく変化する可能性
- 因果関係を意味しない: 相関があっても因果関係とは限らない
- 対称性: Cor(X,Y) = Cor(Y,X)
したがって、ピアソンの相関係数rが取りうる範囲は-1〜1です。