母比率の区間推定に関する問題です。
1. 母比率の信頼区間の基本
二項分布に従うデータから母比率 $p$ の信頼区間を構成する方法として、正規近似を用いた方法があります。標本サイズが十分に大きく、$np \geq 5$ かつ $n(1-p) \geq 5$ を満たす場合、この近似は良好です。
母比率 $p$ の $(1-\alpha) \times 100\%$ 信頼区間は以下のように表されます:
$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
ここで、$\hat{p}$ は標本比率(成功数/標本サイズ)、$n$ は標本サイズ、$z_{\alpha/2}$ は標準正規分布の上側 $\alpha/2$ 点です。
2. 問題の設定
この問題では:
- 不良品の数:$X = 15$
- 標本サイズ:$n = 200$
- 標本比率:$\hat{p} = \frac{X}{n} = \frac{15}{200} = 0.075$
- 信頼水準:$1 - \alpha = 0.95$(95%信頼区間)
3. 正規近似の適用条件の確認
$np = 200 \times 0.075 = 15 \geq 5$ かつ $n(1-p) = 200 \times 0.925 = 185 \geq 5$ なので、正規近似の条件を満たしています。
4. 信頼区間の計算
95%信頼区間なので、$\alpha = 0.05$ であり、$\alpha/2 = 0.025$ です。
標準正規分布表または計算ツールを用いて、$z_{0.025} = 1.96$ を得ます。
標準誤差は:
$\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.075 \times 0.925}{200}} = \sqrt{\frac{0.069375}{200}} = \sqrt{0.000346875} \approx 0.0186$
したがって、95%信頼区間は:
\begin{align}\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} &= 0.075 \pm 1.96 \times 0.0186 \\
&= 0.075 \pm 0.0365 \\
&= [0.0385, 0.1115]\end{align}
小数第3位まで四捨五入すると、$[0.039, 0.112]$ となります。
5. 連続性の補正(オプション)
より正確な信頼区間を得るために、連続性の補正を適用することもあります。連続性の補正を適用した95%信頼区間は:
\begin{align}\left[\hat{p} - z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} - \frac{0.5}{n}, \hat{p} + z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} + \frac{0.5}{n}\right]\end{align}
この問題では、$\frac{0.5}{n} = \frac{0.5}{200} = 0.0025$ となります。
連続性の補正を適用した95%信頼区間は:
\begin{align}&[0.0385 - 0.0025, 0.1115 + 0.0025] \\
&= [0.036, 0.114]\end{align}
小数第3位まで四捨五入すると、$[0.036, 0.114]$ となります。
6. ウィルソンのスコア区間(参考)
母比率の信頼区間を構成する別の方法として、ウィルソンのスコア区間があります。これは、特に標本サイズが小さい場合や、比率が0や1に近い場合に、より正確な信頼区間を提供します。
ウィルソンのスコア区間の公式は複雑ですが、この問題では標本サイズが十分に大きいため、通常の正規近似による信頼区間で十分です。
母比率の信頼区間の特徴と注意点:
- 標本サイズが小さい場合や、比率が0や1に近い場合は、正規近似による信頼区間は不正確になる可能性があります。
- 連続性の補正を適用すると、離散的な二項分布を連続的な正規分布で近似する際の誤差を減らすことができます。
- 信頼区間の幅は、標本サイズが大きいほど狭くなります。
- 信頼区間の幅は、標本比率が0.5に近いほど広くなります(分散が最大になるため)。
この問題では、200個の製品のうち15個が不良品であった場合の母比率の95%信頼区間を求めました。計算の結果、信頼区間は $[0.039, 0.112]$ となります。