基礎問題集
数学1 データの分析「データの分析」の問題2 解説
数学1のデータの分析「データの分析」にある問題2の基礎問題と解説ページです。問題と保存済み解説を公開し、ログイン後はAI質問と学習履歴も利用できます。
MathGrAIl の基礎問題集にある公開問題ページです。ログイン前でも問題と保存済み解説を確認でき、ログイン後はAI質問と学習履歴の保存を利用できます。
- 基礎問題の問題画像と保存済み解説を公開
- ログイン後にAI質問で復習
- ログイン後に学習履歴を保存
解説
方針・初手
変量 $x$ の分散は、データの数が $5$ 個と少なく、値も計算しやすい整数であるため、平均を求めてから定義に従って計算するか、公式を用いて計算する。
変量 $9-x$ と $x$ の相関係数については、一方が他方の $1$ 次式で表される関係にあることに着目し、相関係数の性質を利用すると計算を省略できる。
解法1
与えられたデータ $x$ の値は $3, 9, 1, 7, 5$ である。
まず、$x$ の平均値 $\bar{x}$ を求める。
$$\bar{x} = \frac{3 + 9 + 1 + 7 + 5}{5} = \frac{25}{5} = 5$$
各データから平均値 $\bar{x}$ を引いた偏差 $x - \bar{x}$ は、順に以下のようになる。
$$-2, \quad 4, \quad -4, \quad 2, \quad 0$$
分散 $s_x^2$ は偏差の $2$ 乗の平均であるから、次のように計算できる。
$$\begin{aligned} s_x^2 &= \frac{(-2)^2 + 4^2 + (-4)^2 + 2^2 + 0^2}{5} \\ &= \frac{4 + 16 + 16 + 4 + 0}{5} \\ &= \frac{40}{5} \\ &= 8 \end{aligned}$$
したがって、[ オ ] に当てはまる値は $8$ である。
次に、変量 $y = 9 - x$ とおく。
これは $y = -x + 9$ と表すことができ、変量 $y$ は変量 $x$ の $1$ 次式である。
一般に、変量 $y = ax + b$ ($a, b$ は定数で $a \neq 0$)と変量 $x$ の相関係数 $r$ は、$a > 0$ のとき $r = 1$、$a < 0$ のとき $r = -1$ となる性質がある。
今回は $a = -1 < 0$ であるから、$y$ と $x$ の相関係数は $-1$ である。
したがって、[ カ ] に当てはまる値は $-1$ である。
解法2
分散を「($2$ 乗の平均)$-$(平均の $2$ 乗)」の公式を用いて計算し、相関係数を共分散から定義通りに計算する。
$x$ の平均値 $\bar{x}$ は解法1と同様に $5$ である。
$x^2$ の値は、順に以下のようになる。
$$9, \quad 81, \quad 1, \quad 49, \quad 25$$
$x^2$ の平均値 $\overline{x^2}$ を求める。
$$\overline{x^2} = \frac{9 + 81 + 1 + 49 + 25}{5} = \frac{165}{5} = 33$$
したがって、分散 $s_x^2$ は次のように計算できる。
$$\begin{aligned} s_x^2 &= \overline{x^2} - (\bar{x})^2 \\ &= 33 - 5^2 \\ &= 33 - 25 \\ &= 8 \end{aligned}$$
次に、変量 $y = 9 - x$ と $x$ の共分散 $s_{xy}$ を求める。
$y$ の平均値 $\bar{y}$ は、変量の変換の性質から次のように求まる。
$$\bar{y} = 9 - \bar{x} = 9 - 5 = 4$$
$y$ の偏差 $y - \bar{y}$ は、$(9 - x) - 4 = 5 - x$ であるから、順に以下のようになる。
$$2, \quad -4, \quad 4, \quad -2, \quad 0$$
$x$ の偏差 $x - \bar{x}$ は、解法1より $-2, 4, -4, 2, 0$ である。
共分散 $s_{xy}$ は、それぞれの偏差の積の平均であるから、次のように計算できる。
$$\begin{aligned} s_{xy} &= \frac{-2 \cdot 2 + 4 \cdot (-4) + (-4) \cdot 4 + 2 \cdot (-2) + 0 \cdot 0}{5} \\ &= \frac{-4 - 16 - 16 - 4 + 0}{5} \\ &= \frac{-40}{5} \\ &= -8 \end{aligned}$$
また、$y = -x + 9$ であるから、$y$ の分散 $s_y^2$ は $s_y^2 = (-1)^2 s_x^2 = 8$ となる。
したがって、$y$ の標準偏差 $s_y$ は $\sqrt{8}$ であり、$x$ の標準偏差 $s_x$ も $\sqrt{8}$ である。
求める相関係数 $r$ は、次のように計算できる。
$$r = \frac{s_{xy}}{s_x s_y} = \frac{-8}{\sqrt{8} \sqrt{8}} = \frac{-8}{8} = -1$$
解説
データの分析における基本的な計算問題である。分散の求め方には、定義通り「偏差の $2$ 乗の平均」を計算する方法と、「($2$ 乗の平均)$-$(平均の $2$ 乗)」を利用する方法の $2$ 通りがあり、データの値によって計算しやすい方を選択できるようにしておきたい。本問のように平均値が整数の場合は、定義通りに計算した方が早いことが多い。
また、変量の変換 $y = ax + b$ に関する性質は頻出である。 平均:$\bar{y} = a\bar{x} + b$ 分散:$s_y^2 = a^2 s_x^2$ 標準偏差:$s_y = |a|s_x$ 相関係数:$a$ の符号のみに依存し、$a > 0$ ならば $1$、$a < 0$ ならば $-1$
これらを暗記しておくと、相関係数の計算などの手間を大幅に省くことができる。
答え
オ:$8$
カ:$-1$