基礎問題集
数学B 確率分布・統計的推測「推定」の問題1 解説
数学Bの確率分布・統計的推測「推定」にある問題1の基礎問題と解説ページです。問題と保存済み解説を公開し、ログイン後はAI質問と学習履歴も利用できます。
MathGrAIl の基礎問題集にある公開問題ページです。ログイン前でも問題と保存済み解説を確認でき、ログイン後はAI質問と学習履歴の保存を利用できます。
- 基礎問題の問題画像と保存済み解説を公開
- ログイン後にAI質問で復習
- ログイン後に学習履歴を保存
解説
方針・初手
各 $X_i$ は、薬の効果が認められたかどうかを表す $0,1$ の確率変数である。したがって $X_i$ は成功確率 $p$ のベルヌーイ分布に従う。
標本平均 $\overline{X}$ は「薬の効果が認められた患者の割合」を表すので、(1) ではベルヌーイ分布の平均・分散から求める。(2) では標本比率を用いて、正規近似による母比率 $p$ の信頼区間を作る。
解法1
**(1)**
$i$ 番目の患者に薬の効果が認められる確率は $p$ であるから、
$$ P(X_i=1)=p,\qquad P(X_i=0)=1-p
$$
である。
したがって、$X_i$ の平均は
$$ E(X_i)=1\cdot p+0\cdot(1-p)=p
$$
である。また、
$$ E(X_i^2)=1^2\cdot p+0^2\cdot(1-p)=p
$$
より、
$$ V(X_i)=E(X_i^2)-{E(X_i)}^2=p-p^2=p(1-p)
$$
となる。
標本平均は
$$ \overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_i
$$
である。$X_1,X_2,\dots,X_n$ は無作為に選ばれた患者についての確率変数なので、互いに独立で同じ分布に従うとみなせる。
よって、標本平均の平均は
$$ E(\overline{X}) =E\left(\frac{1}{n}\sum_{i=1}^{n}X_i\right) =\frac{1}{n}\sum_{i=1}^{n}E(X_i) =\frac{1}{n}\cdot np =p
$$
である。
また、独立性より分散は和に分けられるから、
$$ V(\overline{X}) =V\left(\frac{1}{n}\sum_{i=1}^{n}X_i\right) =\frac{1}{n^2}\sum_{i=1}^{n}V(X_i) =\frac{1}{n^2}\cdot np(1-p) =\frac{p(1-p)}{n}
$$
である。
**(2)**
標本の大きさは $400$、薬の効果が認められた人数は $320$ であるから、標本比率は
$$ \overline{X}=\frac{320}{400}=0.8
$$
である。
標本の大きさ $400$ は十分大きいので、標本比率 $\overline{X}$ は近似的に正規分布に従うとみなせる。母比率 $p$ の推定では、分散中の $p$ を標本比率 $\overline{X}=0.8$ で置き換える。
したがって、標準誤差は
$$ \begin{aligned} \sqrt{\frac{\overline{X}(1-\overline{X})}{400}} &= \sqrt{\frac{0.8\cdot 0.2}{400}} \\ \sqrt{0.0004} \\ 0.02 \end{aligned} $$
である。
標準正規分布に従う確率変数 $Z$ について
$$ P(Z<-1.96)=0.025
$$
であるから、対称性より
$$ P(-1.96<Z<1.96)=0.95
$$
である。
よって、信頼度 $95%$ の信頼区間は
$$ 0.8\pm 1.96\cdot 0.02
$$
で与えられる。
計算すると、
$$ 1.96\cdot 0.02=0.0392
$$
であるから、
$$ 0.8-0.0392=0.7608,\qquad 0.8+0.0392=0.8392
$$
となる。
小数第 $3$ 位を四捨五入すると、
$$ 0.76\leqq p\leqq 0.84
$$
である。
解説
この問題では、$X_i$ がベルヌーイ分布に従うことを正しく見抜くことが重要である。$X_i$ は薬が効いた人数そのものではなく、各患者について効果が認められたかどうかを表す $0,1$ の確率変数である。
標本平均 $\overline{X}$ は、通常の平均であると同時に、この問題では「効果が認められた割合」を表す。そのため、母比率 $p$ の推定量として自然に使える。
信頼区間では、母比率 $p$ は未知であるため、標準誤差の計算では標本比率 $0.8$ を代入する。ここで $p(1-p)$ の $p$ にそのまま未知の $p$ を残すと、具体的な数値の信頼区間が出せない。
答え
**(1)**
$$ E(\overline{X})=p
$$
$$ V(\overline{X})=\frac{p(1-p)}{n}
$$
**(2)**
母比率 $p$ の信頼度 $95%$ の信頼区間は
$$ 0.76\leqq p\leqq 0.84
$$