基礎問題集
数学1 データの分析「データの分析」の問題6 解説
数学1のデータの分析「データの分析」にある問題6の基礎問題と解説ページです。問題と保存済み解説を公開し、ログイン後はAI質問と学習履歴も利用できます。
MathGrAIl の基礎問題集にある公開問題ページです。ログイン前でも問題と保存済み解説を確認でき、ログイン後はAI質問と学習履歴の保存を利用できます。
- 基礎問題の問題画像と保存済み解説を公開
- ログイン後にAI質問で復習
- ログイン後に学習履歴を保存
解説
方針・初手
標準偏差 $s$ の定義から、
$$ s^2=\frac{1}{15}\sum_{i=1}^{15}(x_i-\overline{x})^2 $$
である。したがって
$$ \sum_{i=1}^{15}(x_i-\overline{x})^2=15s^2 $$
が成り立つ。
各データの平均からのずれの二乗の総和が $15s^2$ に等しいことを用いれば、ある $x_i$ が大きく離れすぎることや、そのような $x_i$ が多数存在することは直ちに矛盾する。
解法1
標準偏差の定義より、
$$ \sum_{i=1}^{15}(x_i-\overline{x})^2=15s^2 $$
である。
**(1)**
$\lvert x_i-\overline{x}\rvert>4s$ をみたす $x_i$ が存在すると仮定する。
そのような添字を $k$ とすると、
$$ |x_k-\overline{x}|>4s $$
より、
$$ (x_k-\overline{x})^2>16s^2 $$
となる。
ところが、各項 $(x_i-\overline{x})^2$ はすべて $0$ 以上であるから、
$$ \sum_{i=1}^{15}(x_i-\overline{x})^2 \ge (x_k-\overline{x})^2>16s^2 $$
となる。
一方で、この総和は $15s^2$ に等しいので、
$$ 15s^2>16s^2 $$
となって矛盾する。
したがって、$\lvert x_i-\overline{x}\rvert>4s$ をみたす $x_i$ は存在しない。
**(2)**
$\lvert x_i-\overline{x}\rvert>2s$ をみたす $x_i$ が $4$ 個以上存在すると仮定する。
そのような $4$ 個を $x_{i_1},x_{i_2},x_{i_3},x_{i_4}$ とすると、それぞれについて
$$ |x_{i_j}-\overline{x}|>2s \qquad (j=1,2,3,4) $$
であるから、
$$ (x_{i_j}-\overline{x})^2>4s^2 \qquad (j=1,2,3,4) $$
となる。
よって、
$$ \begin{aligned} \sum_{i=1}^{15}(x_i-\overline{x})^2 &\ge \sum_{j=1}^{4}(x_{i_j}-\overline{x})^2 \\ &>4\cdot 4s^2\\ &=16s^2 \end{aligned} $$
となる。
しかし、左辺は $15s^2$ に等しいので矛盾する。
したがって、$\lvert x_i-\overline{x}\rvert>2s$ をみたす $x_i$ の個数は $3$ 以下である。
解説
この問題の本質は、標準偏差の定義が「平均からのずれの二乗の平均」であることである。
したがって、あるデータが平均から大きく離れていれば、その二乗が総和 $\sum (x_i-\overline{x})^2=15s^2$ を大きく押し上げる。ところが総和は $15s^2$ と決まっているので、離れすぎるデータは存在できず、またそのようなデータが多く存在することもできない。
(1) は「1個でも $4s$ を超えて離れると総和が $16s^2$ を超えてしまう」という見方であり、(2) は「$2s$ を超えて離れるものが4個あると、それだけで総和が $16s^2$ を超える」という見方である。どちらも同じ発想で処理できる。
答え
$$ \sum_{i=1}^{15}(x_i-\overline{x})^2=15s^2 $$
を用いると、
$\lvert x_i-\overline{x}\rvert>4s$ をみたす $x_i$ は存在しない。
$\lvert x_i-\overline{x}\rvert>2s$ をみたす $x_i$ の個数は $3$ 以下である。