この問題では、時系列データ分析の基本的な手法の一つである移動平均 (Moving Average) の計算方法と、その目的や特性について理解を深めます。移動平均は、データの短期的な変動を平滑化し、長期的な傾向やパターンを捉えやすくするために用いられます。
移動平均 (Moving Average) とは?
移動平均は、時系列データのある一定期間のデータ点の平均値を計算し、それをその期間の中央の時点の値とする手法です。期間を一つずつずらしながら平均値を計算していくため、「移動」平均と呼ばれます。
主な目的:
- 平滑化 (Smoothing): ランダムな変動やノイズを除去し、データの基本的な傾向を明確にします。
- トレンドの抽出: 長期的な上昇・下降傾向(トレンド)を把握しやすくします。
- 季節性の除去の補助: 適切な期間の移動平均を取ることで、周期的な変動(季節性)の影響を軽減できる場合があります。
$k$ 期移動平均の計算式(時点 $t$ における値 $Y_t$):
$MA_t = \frac{1}{k} \sum_{i=-(k-1)/2}^{(k-1)/2} Y_{t+i} \quad (\text{kが奇数の場合})$
あるいは、より単純に過去 $k$ 期間の平均として定義されることもあります(この問題では、文脈から中心化移動平均ではなく、単純な過去期間の平均を計算し、その結果を期間の最後の時点に関連付ける形で良いでしょう。ただし、選択肢の形式を見ると、計算結果を期間の中央に割り当てる中心化移動平均の考え方で計算されているようです。ここでは後者で解説を進めます)。
1. 3期移動平均の計算方法の確認
3期移動平均では、連続する3つのデータ点の平均を計算し、その値を3つのデータ点の中央の時点に対応させます。
データ: $Y_1, Y_2, Y_3, Y_4, Y_5, ...$
- 第2時点の3期移動平均値: $(Y_1 + Y_2 + Y_3) / 3$
- 第3時点の3期移動平均値: $(Y_2 + Y_3 + Y_4) / 3$
- 第4時点の3期移動平均値: $(Y_3 + Y_4 + Y_5) / 3$
- ...
移動平均を計算すると、元の系列よりもデータ数が減少することに注意が必要です(この場合、最初と最後のデータ点には対応する移動平均値が計算できません)。
2. 与えられたデータでの3期移動平均の計算
与えられた時系列データは $Y_1=10, Y_2=15, Y_3=12, Y_4=18, Y_5=20$ です。
最初の3期移動平均値 (時点2に対応):
$MA_2 = \frac{Y_1 + Y_2 + Y_3}{3} = \frac{10 + 15 + 12}{3} = \frac{37}{3} \approx 12.333...$
小数第1位まで求めると $12.3$ です。
次の3期移動平均値 (時点3に対応):
$MA_3 = \frac{Y_2 + Y_3 + Y_4}{3} = \frac{15 + 12 + 18}{3} = \frac{45}{3} = 15.0$
最後の3期移動平均値 (時点4に対応):
$MA_4 = \frac{Y_3 + Y_4 + Y_5}{3} = \frac{12 + 18 + 20}{3} = \frac{50}{3} \approx 16.666...$
小数第1位まで求めると $16.7$ です。
したがって、3期移動平均の系列は $(12.3, 15.0, 16.7)$ となります。
移動平均の特性と選択
- 期間の選択 ($k$): 移動平均の期間 $k$ の長さは、平滑化の度合いに影響します。
- $k$ が小さいと、平滑化の効果は弱く、元のデータの変動に近くなります。短期的な変動を捉えたい場合に用います。
- $k$ が大きいと、平滑化の効果は強く、より滑らかな曲線となり、長期的なトレンドが明確になります。
季節性があるデータの場合、季節周期と同じ期間の移動平均(例:月次データで12ヶ月移動平均)を取ると、季節変動を除去する効果があります。
- 中心化移動平均と片側移動平均:
- 中心化移動平均 (Centered Moving Average): 平均値を期間の中央の時点に対応させます。過去と未来のデータを使って計算するため、トレンド分析に適していますが、系列の最新の時点では計算できません。奇数期間の場合は計算が容易です。偶数期間の場合は、2段階の移動平均(例:2期移動平均の2期移動平均)などで中心化します。この問題の解答は中心化移動平均の考え方に基づいています。
- 片側移動平均 (Trailing/One-sided Moving Average): 平均値を期間の最後の時点に対応させます。過去のデータのみを使って計算するため、予測やリアルタイムのモニタリングに適しています。
- 情報の損失: 移動平均を計算すると、系列の最初と最後の方のデータ点については移動平均値が得られません($k$期移動平均では、中心化の場合、最初と最後の $(k-1)/2$ 点が失われます)。
- 重み付き移動平均: 単純移動平均では期間内の全てのデータ点に同じ重みを与えますが、重み付き移動平均 (Weighted Moving Average, WMA) では、時点によって異なる重みを与えます(例:新しいデータほど大きな重みを与える)。指数平滑移動平均 (EMA) もその一種です。
移動平均はシンプルながら強力なツールですが、どの期間を選ぶか、どの種類の移動平均を使うかによって結果の解釈が変わるため、分析の目的に応じて適切に選択することが重要です。
時系列データ分析における位置づけ:
移動平均は、時系列データの記述的な分析手法として基本ですが、より進んだ分析手法(ARIMAモデル、状態空間モデルなど)の基礎となったり、前処理として利用されたりします。
この問題で計算した結果は $12.3, 15.0, 16.7$ であり、選択肢 0 「12.3, 15.0, 16.7」 (選択肢の表示を修正しました。元は15と16.7) と一致します。