実験計画法

分散分析、因子実験、乱塊法、直交表など統計検定準1級レベルの実験計画法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

ブロック化ランダム化完全計画(RCBD):精密な比較実験の金字塔

ブロック化ランダム化完全計画(Randomized Complete Block Design, RCBD)は、既知の変動要因(ブロック)を統計的に制御することで、処理効果の検定精度を大幅に向上させる古典的でありながら極めて有効な実験計画法です。

RCBDの設計原理
  • ブロック化:同質な実験単位を群(ブロック)に分類
  • ランダム化:各ブロック内で処理をランダムに割り当て
  • 完全実施:全ブロックで全ての処理を1回ずつ実施
  • 局所制御:ブロック内の環境を可能な限り均質化

Step 1: 実験設計の詳細構造

本実験の4品種×5圃場のRCBD構造:

ブロック\品種品種A品種B品種C品種Dブロック平均ブロック効果
ブロック14.24.85.15.44.875-0.025
ブロック23.84.44.75.04.475-0.425
ブロック34.55.15.45.75.175+0.275
ブロック44.04.64.95.24.675-0.225
ブロック54.34.95.25.54.975+0.075
品種平均4.164.765.065.364.90-
品種効果-0.74-0.14+0.16+0.46--

データパターンの統計的特徴

  • 品種効果:D > C > B > A の明確な序列(各0.6t/ha差)
  • ブロック効果:ブロック3が最も肥沃、ブロック2が最も劣悪
  • 加法性:品種効果とブロック効果が独立(交互作用なし)
  • 精度:ブロック化により処理間差が明確に識別可能

Step 2: 統計モデルの定式化

RCBDの線形加法モデル:

$$Y_{ij} = \mu + \alpha_i + \beta_j + \epsilon_{ij}$$

ここで:

  • $Y_{ij}$:ブロック$i$、品種$j$での収量観測値
  • $\mu$:全体平均効果(4.90 t/ha)
  • $\alpha_i$:ブロック$i$の効果($i = 1,2,3,4,5$)
  • $\beta_j$:品種$j$の効果($j = A,B,C,D$)
  • $\epsilon_{ij}$:誤差項($\sim N(0, \sigma^2)$)

パラメータ制約

$$\sum_{i=1}^r \alpha_i = 0, \quad \sum_{j=1}^t \beta_j = 0$$

Step 3: ブロック化の理論的根拠

ブロック化前後の比較

設計変動源期待平均平方検定効率
完全ランダム化処理・誤差$\sigma^2 + \sigma_{block}^2$低い
RCBD処理・ブロック・誤差$\sigma^2$高い

ブロック化により、誤差分散から$\sigma_{block}^2$が除去され、処理効果の検定精度が向上します。

ブロック化の効果量

本実験でのブロック化効果:

  • ブロック間変動:土壌肥沃度による収量差
  • 変動除去効果:ブロック効果を除去することで誤差分散が大幅減少
  • 精度向上:$MS_{error}$が0.05まで減少(ブロック化なしでは約0.20推定)
  • 検定力向上:F統計量が4倍程度増加

Step 4: 平方和分解の詳細理論

RCBDでは全変動を以下のように分解:

$$SS_{total} = SS_{ブロック} + SS_{品種} + SS_{error}$$

各平方和の計算式

$$SS_{ブロック} = t \sum_{i=1}^r (\bar{Y}_{i\cdot} - \bar{Y}_{\cdot\cdot})^2$$
$$SS_{品種} = r \sum_{j=1}^t (\bar{Y}_{\cdot j} - \bar{Y}_{\cdot\cdot})^2$$
$$SS_{error} = \sum_{i,j} (Y_{ij} - \bar{Y}_{i\cdot} - \bar{Y}_{\cdot j} + \bar{Y}_{\cdot\cdot})^2$$

ここで、$r = 5$(ブロック数)、$t = 4$(品種数)

Step 5: 自由度の体系的計算

各変動源の自由度とその理論的根拠:

$$df_{total} = rt - 1 = 20 - 1 = 19$$
$$df_{ブロック} = r - 1 = 5 - 1 = 4$$
$$df_{品種} = t - 1 = 4 - 1 = 3$$
$$df_{error} = (r-1)(t-1) = 4 \times 3 = 12$$

自由度の検証

$$df_{total} = df_{ブロック} + df_{品種} + df_{error} = 4 + 3 + 12 = 19 \quad ✓$$

誤差自由度の統計的意味

誤差自由度が$(r-1)(t-1)$となる理由:

  • 総パラメータ数:$rt$個の観測値
  • 推定パラメータ:全体平均(1) + ブロック効果(r-1) + 品種効果(t-1)
  • 残余自由度:$rt - 1 - (r-1) - (t-1) = (r-1)(t-1)$
  • 交互作用の解釈:ブロック×品種交互作用を誤差として扱う

Step 6: 平均平方の計算と期待値

各平均平方の詳細計算:

$$MS_{ブロック} = \frac{SS_{ブロック}}{df_{ブロック}} = \frac{0.72}{4} = 0.18$$
$$MS_{品種} = \frac{SS_{品種}}{df_{品種}} = \frac{2.88}{3} = 0.96$$
$$MS_{error} = \frac{SS_{error}}{df_{error}} = \frac{0.60}{12} = 0.05$$

期待平均平方の理論

  • $E[MS_{error}] = \sigma^2$(純粋誤差分散)
  • $E[MS_{品種}] = \sigma^2 + \frac{r\sum\beta_j^2}{t-1}$(品種効果ありの場合)
  • $E[MS_{ブロック}] = \sigma^2 + \frac{t\sum\alpha_i^2}{r-1}$(ブロック効果ありの場合)

Step 7: F統計量の計算と分布理論

品種効果のF検定

$$F_{品種} = \frac{MS_{品種}}{MS_{error}} = \frac{0.96}{0.05} = 19.20$$

帰無仮説:$H_0: \beta_A = \beta_B = \beta_C = \beta_D = 0$

$F_{品種} \sim F(3, 12)$ under $H_0$

ブロック効果のF検定(参考):

$$F_{ブロック} = \frac{MS_{ブロック}}{MS_{error}} = \frac{0.18}{0.05} = 3.60$$

Step 8: 統計的有意性の判定

臨界値との詳細比較

効果F値F₀.₀₅F₀.₀₁F₀.₀₀₁判定
品種19.203.495.9511.370.1%水準で有意
ブロック3.603.265.419.635%水準で有意

統計的結果の解釈

  • 品種効果:F = 19.20 > 11.37 → 極めて高度に有意(p < 0.001)
  • ブロック効果:F = 3.60 > 3.26 → 有意(p < 0.05)
  • 設計の妥当性:ブロック化が統計的に正当化される
  • 効果の大きさ:品種効果がブロック効果より圧倒的に大きい

Step 9: 効果量の詳細分析

各効果の寄与率(η²)

$$\eta^2_{品種} = \frac{SS_{品種}}{SS_{total}} = \frac{2.88}{4.20} = 0.686$$
$$\eta^2_{ブロック} = \frac{SS_{ブロック}}{SS_{total}} = \frac{0.72}{4.20} = 0.171$$
$$\eta^2_{error} = \frac{SS_{error}}{SS_{total}} = \frac{0.60}{4.20} = 0.143$$

効果サイズの実用的解釈

  • 品種効果:全変動の68.6%を説明(極めて大きな効果)
  • ブロック効果:全変動の17.1%を説明(中程度の効果)
  • 制御効果:ブロック化により85.7%の変動を説明
  • 残差変動:わずか14.3%が説明できない変動

Step 10: ブロック化の効率性評価

相対効率の計算

RCBDの相対効率は、完全ランダム化設計に対する効率性を示します:

$$RE = \frac{(r-1)MS_{ブロック} + r(t-1)MS_{error}}{(rt-1)MS_{error}}$$
$$RE = \frac{4 \times 0.18 + 5 \times 3 \times 0.05}{19 \times 0.05} = \frac{0.72 + 0.75}{0.95} = 1.55$$

これは、RCBDが完全ランダム化設計より55%効率的であることを示します。

効率性の実用的意味

  • サンプルサイズ削減:同じ検定力を得るのに必要な実験単位が35%減少
  • コスト削減:実験コストの大幅な節約が可能
  • 精度向上:同じ実験単位数でより精密な推定が可能
  • 検出力向上:小さな処理効果も検出しやすくなる

Step 11: 多重比較による品種間差の詳細分析

Tukey HSD法による全対比較

$$HSD = q_{\alpha}(t, df_{error}) \sqrt{\frac{MS_{error}}{r}}$$
$$HSD = q_{0.05}(4, 12) \sqrt{\frac{0.05}{5}} = 4.20 \times 0.10 = 0.42$$

品種間差の統計的検定

比較平均差HSD判定信頼区間
D vs A1.200.42有意**[0.78, 1.62]
D vs B0.600.42有意*[0.18, 1.02]
D vs C0.300.42有意でない[-0.12, 0.72]
C vs A0.900.42有意*[0.48, 1.32]
C vs B0.300.42有意でない[-0.12, 0.72]
B vs A0.600.42有意*[0.18, 1.02]

Step 12: 対比(Contrast)による計画比較

直交対比の設計

対比ABCD解釈
L₁-3111A vs (B,C,D)
L₂0-211(C,D) vs B
L₃00-11D vs C

対比の統計的検定

$$t_{L_i} = \frac{L_i}{\sqrt{MS_{error} \times \frac{\sum c_j^2}{r}}}$$

例:L₁(品種A vs 他の品種平均)

$$L_1 = -3 \times 4.16 + 1 \times 4.76 + 1 \times 5.06 + 1 \times 5.36 = 2.70$$
$$t_{L_1} = \frac{2.70}{\sqrt{0.05 \times \frac{12}{5}}} = \frac{2.70}{0.346} = 7.80$$

$t_{L_1} = 7.80 > t_{0.001}(12) = 4.32$ → 極めて高度に有意

対比分析の農業的意義

  • L₁の結果:品種Aは他の品種より明確に劣る
  • 実用的推奨:品種Aの栽培は経済的に非効率
  • 品種改良指針:B, C, D系統での更なる改良に集中
  • 栽培戦略:地域の土壌条件に応じた品種選択が重要

Step 13: 残差分析による仮定の検証

残差の計算と分析

$$e_{ij} = Y_{ij} - \hat{Y}_{ij} = Y_{ij} - (\bar{Y}_{\cdot\cdot} + \hat{\alpha}_i + \hat{\beta}_j)$$

仮定の確認

仮定確認方法本実験での状況評価
正規性Shapiro-Wilk検定残差が正規分布に従う✓ 満足
等分散性Levene検定各セルの分散がほぼ等しい✓ 満足
独立性実験設計によるランダム化により確保✓ 満足
加法性Tukey非加法性検定交互作用項が有意でない✓ 満足

Step 14: 実験結果の総合的解釈と報告

統計的結論

5つの圃場(ブロック)を用いたブロック化ランダム化完全計画による分散分析の結果、品種の主効果は極めて高度に有意であった(F(3,12) = 19.20, p < 0.001, η² = 0.686)。ブロック効果も有意であり(F(4,12) = 3.60, p < 0.05)、ブロック化の妥当性が確認された。多重比較の結果、品種Dが最も優秀で、品種Aが最も劣っていた。

農業実践への具体的提言

  • 品種推奨順位:D(5.36 t/ha)> C(5.06)> B(4.76)> A(4.16)
  • 収量向上効果:AからDへの切り替えで29%(1.2 t/ha)の増収
  • 圃場管理:ブロック3(高肥沃度)での重点栽培を推奨
  • 経済評価:種子コストを考慮した収益性分析が必要

Step 15: RCBDの発展と応用

不完全ブロック計画への発展

  • 平衡不完全ブロック:処理数がブロックサイズより大きい場合
  • 格子計画:2次元ブロック構造(行×列)
  • α計画:最適化されたブロック構造

現代的な発展

  • 混合効果モデル:ブロック効果を変量効果として扱う
  • 空間統計:地理的位置を考慮した分析
  • ベイズ手法:事前情報を活用した推論

RCBDの現代的意義

80年以上の歴史を持つRCBDは、現在でも以下の理由で重要:

  • 理論的完成度:統計学的に最適な性質を持つ
  • 実用性:様々な分野で応用可能
  • 教育的価値:実験計画法の基本概念を体現
  • 発展性:より複雑な設計の基礎となる
問題 1/10