137

機械学習関連の技術記事を投稿します。137と言えば微細構造定数

【統計学入門(東京大学出版会)】第5章 練習問題 解答

東京大学出版会から出版されている統計学入門(基礎統計学Ⅰ)について第5章の練習問題の解答を書いていきます。

本章以外の解答

本章以外の練習問題の解答は別の記事で公開しています。
必要に応じて参照してください。

5.1

i)

密度関数

一様分布の密度関数  f(x) を次に示します。


\begin{equation}
f(x)
  \begin{cases}
    \displaystyle \frac{1}{6} & (0 \le x \le 6) \\
    0 & (x \lt 0, 6 \lt x)
  \end{cases}
\end{equation}

期待値

期待値  E(X) は、


\begin{align}
\displaystyle E(X) &= \int_{-\infty}^{\infty} x \cdot f(x) dx \\
&= \int_{0}^{6} \frac{x}{6} dx \\
&= 3
\end{align}

となります。

分散


\begin{align}
\displaystyle E(X^{2}) &= \int_{-\infty}^{\infty} x^{2} \cdot f(x) dx  \\
&= \int_{0}^{6} \frac{x^{2}}{6} dx \\
&= 12
\end{align}

と求まるので、

分散は  V(X) は、


\begin{align}
\displaystyle V(X) &= E(X^{2}) - E(X)^{2} \\
&= 12 - 3^{2} \\
&= 3
\end{align}

となります。

ii)

チェビシェフの不等式は、次の式で与えられます。


\displaystyle P(|X - \mu| \ge k \sigma) \le \frac{1}{k^{2}}

したがって、i)の結果を利用して、


\displaystyle P(|X - 3| \ge \sqrt{3} k) = P(3 - \sqrt{3} k \ge X \ge 3 + \sqrt{3} k) \le \frac{1}{k^{2}}

が成り立つことを適当なk(ここでは  k = 1 とします)について確認すればよいことになります。


\begin{align}
\displaystyle P(3 - \sqrt{3} k \ge X \ge 3 + \sqrt{3} k) &= P(3 - \sqrt{3} \ge X \ge 3 + \sqrt{3}) \\
&= \int_{3 - \sqrt{3}}^{3 + \sqrt{3}} f(x) dx \\
&= \int_{3 - \sqrt{3}}^{3 + \sqrt{3}} \frac{1}{6} dx \\
&= 0.57735 \quad (\le 1)
\end{align}

となり、不等式が成り立つことが確認できました。

iii)

密度関数  f(x) を次に示します。


\begin{equation}
f(x)
  \begin{cases}
    \displaystyle 1 & (0 \le x \le 1) \\
    0 & (x \lt 0, 1 \lt x)
  \end{cases}
\end{equation}

これから、


\begin{align}
\displaystyle E(X) &= \int_{-\infty}^{\infty} x \cdot f(x) dx \\
&= \int_{0}^{1} x dx \\
&= \frac{1}{2}
\end{align}

\begin{align}
\displaystyle E(X^{2}) &= \int_{-\infty}^{\infty} x^{2} \cdot f(x) dx \\
&= \int_{0}^{1} x^{2} dx \\
&= \frac{1}{3}
\end{align}

\begin{align}
\displaystyle E(X^{3}) &= \int_{-\infty}^{\infty} x^{3} \cdot f(x) dx \\ 
&= \int_{0}^{1} x^{3} dx \\
&= \frac{1}{4}
\end{align}

\begin{align}
\displaystyle E(X^{4}) &= \int_{-\infty}^{\infty} x^{4} \cdot f(x) dx \\
&= \int_{0}^{1} x^{4} dx \\
&= \frac{1}{5}
\end{align}

と求まります。

歪度

歪度  \alpha_{3} は、


\displaystyle \alpha_{3} = \frac{E((X - \mu)^{3})}{\sigma^{3}}

で求めますが、


\begin{align}
\displaystyle  E((X - \mu)^{3}) &= E(X^{3}) - 3 \mu E(X^{2}) + 2 \mu^{2} \\
&= \frac{1}{4} - 3 \cdot \frac{1}{2} \cdot \frac{1}{3} + 2 \cdot \left( \frac{1}{2} \right)^{3} \\
&= 0
\end{align}

であるため、 \alpha_{3} = 0 となります。

尖度

尖度  \alpha_{4} -3 は、


\displaystyle \alpha_{4} - 3 = \frac{E((X - \mu)^{4})}{\sigma^{4}} - 3

で求めますが、


\begin{align}
\displaystyle \sigma^{2} &= V(X) \\
&= E(X^{2}) - E(X)^{2} \\
&= \frac{1}{3} - \left( \frac{1}{2} \right)^{2} \\
&= \frac{1}{12}
\end{align}

\begin{align}
\displaystyle  E((X - \mu)^{4}) &= E(X^{4}) - 4 \mu E(X^{3}) + 6 \mu^{2} E(X^{2}) - 3 \mu^{4} \\
&= \frac{1}{5} - 4 \cdot \frac{1}{2} \cdot \frac{1}{4} +6 \cdot \left( \frac{1}{2} \right)^{2} \cdot \frac{1}{3} - 3 \cdot \left( \frac{1}{2} \right)^{4} \\
&= \frac{1}{80}
\end{align}

から、


\begin{align}
\displaystyle \alpha_{4} - 3 &= \frac{E((X - \mu)^{4})}{\sigma^{4}} - 3 \\
&= \frac{\frac{1}{80}}{\left( \frac{1}{12} \right)^{2}} - 3 \\
&= - \frac{6}{5}
\end{align}

となります。

5.2

各等級の当選金を  x_{i}、本数を  n_{i} とすると、宝くじの期待値  E(X) は、次の式で表されます。
なお、全本数を  N としました。


\displaystyle E(X) = \sum_{i} x_{i} \cdot \frac{n_{i}}{N}

上記の式を用いて期待値を求めるPythonプログラムを次に示します。

import numpy as np

money = np.array([
    40000000,
    10000000,
    200000,
    10000000,
    100000,
    1000000,
    140000,
    10000,
    1000,
    200
])
num = np.array([
    7,
    14,
    903,
    5,
    645,
    130,
    130,
    1300,
    26000,
    1300000
])

total = np.sum(money * num) / 13000000
print(total)

上記のプログラムを実行した結果を次に示します。

89.4076923076923

5.3

i)

n回目に初めてコインが表になる確率  P(X) は、n-1回目まで裏が出ることと同じであるため、次の式で表されます。


\begin{align}
\displaystyle P(X) &= \left( \frac{1}{2} \right)^{n-1} \cdot \frac{1}{2} \\
&= \frac{1}{2^{n}} \quad (n = 1, 2, 3, ...)
\end{align}

ii)

i)の結果を用いて期待値  E(X) を求めると、


\begin{align}
\displaystyle E(X) &= \sum_{n=1}^{\infty} x_{n} P(X=x_{n}) \\
&= \sum_{n=1}^{\infty} 2^{n} \cdot \frac{1}{2^{n}} \\
&= \sum_{n=1}^{\infty} 1 \\
&= \infty
\end{align}

となり題意は示されました。

5.4

 E(X-a)^{2} を式変形すると、


E(X-a)^{2} = E(X^{2}) - 2aE(X) + a^{2}

となります。上記の式を最小にするためには、 E(X-a)^{2} aについて微分した値が0になればよいので、


\begin{align}
\displaystyle \frac{dE}{da} &= -2E(X) + 2a \\
&= 0
\end{align}

したがって、 a = E(X) のとき  E(X-a)^{2} が最小値  E(X^{2}) - E(X)^{2} をとります。

5.5

正n面体で各面が出る確率は、 \frac{1}{n} です。 ここから、各期待値と分散が求まります。

期待値

期待値  E(X) は、1次式の和の公式  \sum_{i=1}^{n} = \frac{1}{2} n(n+1) を用いて、


\begin{align}
\displaystyle E(X) &= \sum_{i=1}^{n} x_{i} \cdot \frac{1}{n} \\
&= \frac{1}{2} n(n+1) \cdot \frac{1}{n} \\
&= \frac{n+1}{2}
\end{align}

となります。

分散

分散  V(X) は、1次式の和の公式と2次式の和の公式  \sum_{i=1}^{n} = \frac{1}{6} n(n+1)(2n+1) を用いて、


\begin{align}
\displaystyle E(X^{2}) &= \sum_{i=1}^{n} x_{i}^{2} \cdot \frac{1}{n} \\
&=\frac{1}{6} n(n+1)(2n+1) \cdot \frac{1}{n} \\
&= \frac{(n+1)(2n+1)}{6}
\end{align}

\begin{align}
\displaystyle V(X) &= E(X^{2}) - E(X)^{2} \\
&= \frac{(n+1)(2n+1)}{6} - \left( \frac{n+1}{2} \right)^{2} \\
&= \frac{n^{2} - 1}{12}
\end{align}

となります。

5.6

確率変数  X の密度関数  f(x) は、次のように与えられます。


\begin{equation}
f(x)
  \begin{cases}
    1 & (0 \le x \le 1) \\
    0 & (x \lt 0, 1 \lt x)
  \end{cases}
\end{equation}

積分布関数

 X^{2} の累積分布関数  P(X^{2} \le y) は、


\begin{align}
\displaystyle P(X^{2} \le y) &= P(- \sqrt{y} \le X \le \sqrt{y}) \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} f(x) dx \\
&= \int_{0}^{\sqrt{y}} 1 \cdot dx \\
&= \sqrt{y}
\end{align}

と求まります。

密度関数

密度関数  g(y) は、累積分布関数を微分したものであるため、


\begin{align}
\displaystyle g(y) &= \frac{dP}{dy} \\
&= \frac{d}{dy} \sqrt{y} \\
&= \frac{1}{2\sqrt{y}} \quad (0 \le y \le 1)
\end{align}

となります。

期待値

期待値  E(Y) は、


\begin{align}
\displaystyle E(Y) &= \int_{-\infty}^{\infty} y \cdot g(y) dy \\
&= \int_{0}^{1} \frac{\sqrt{y}}{2} dy \\
&= \left[ \frac{y^{3/2}}{3} \right]_{0}^{1} \\
&= \frac{1}{3}
\end{align}

と求まります。

分散


\begin{align}
\displaystyle E(Y^{2}) &= \int_{-\infty}^{\infty} y^{2} \cdot g(y) dy \\
&= \int_{0}^{1} \frac{y^{3/2}}{2} dy \\
&= \left[ \frac{y^{5/2}}{5} \right]_{0}^{1} \\
&= \frac{1}{5}
\end{align}

となるため、分散  V(Y) は、


\begin{align}
\displaystyle V(Y) &= E(Y^{2}) - E(Y)^{2} \\
&= \frac{1}{5} - \left( \frac{1}{3} \right) \\
&= \frac{4}{45}
\end{align}

と求まります。

5.7

確率変数  X の密度関数  f(x) は、次のように与えられます。


\displaystyle f(x) = \frac{1}{\sqrt{2\pi}} \exp \left( - \frac{x^{2}}{2} \right)

積分布関数

 X^{2} の累積分布関数  P(X^{2} \le y) は、


\begin{align}
\displaystyle P(X^{2} \le y) &= P(- \sqrt{y} \le X \le \sqrt{y}) \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} f(x) dx \\
&= \int_{-\sqrt{y}}^{\sqrt{y}} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx
\end{align}

で求めることができます。  \exp \left(- \frac{x^{2}}{2} \right) は偶関数であるため、


\begin{align}
\displaystyle \int_{-\sqrt{y}}^{\sqrt{y}} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx &= 2 \int_{0}^{\sqrt{y}} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx \\
&= 2 \left( \int_{-\infty}^{\sqrt{y}} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx - \int_{-\infty}^{0} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx \right)
\end{align}

ここで、ガウス積分の公式を用いると、


\begin{align}
\displaystyle \int_{-\infty}^{0} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx &= \int_{0}^{\infty} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx \\
&= \frac{1}{\sqrt{2\pi}} \cdot \sqrt{\frac{\pi}{2}} \\
&= \frac{1}{2}
\end{align}

となるため、


\begin{align}
\displaystyle P(X^{2} \le y) &= 2 \left( \int_{-\infty}^{\sqrt{y}} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx - \int_{-\infty}^{0} \frac{1}{\sqrt{2\pi}} \exp \left(- \frac{x^{2}}{2} \right) dx \right) \\
&= 2 \left( \phi(\sqrt{y}) - \frac{1}{2} \right)
\end{align}

が得られます。 ここで  \phi (y) は、標準正規分布の累積分布関数です。

密度関数

密度関数  g(y) は、累積分布関数を微分したものです。


\displaystyle \frac{d}{dy} \phi(y) = \frac{1}{\sqrt{2 \pi}} \exp \left( - \frac{y}{2} \right)

を用いると、


\begin{align}
\displaystyle g(y) &= \frac{dP}{dy} \\
&= \frac{d}{dy} 2 \left( \phi(\sqrt{y}) - \frac{1}{2} \right) \\
&= 2 \cdot \frac{1}{2\sqrt{y}} \cdot \frac{d}{dy} \phi (\sqrt{y}) \\
&= \frac{1}{\sqrt{2 \pi y}} \exp \left( - \frac{y}{2} \right) \quad (y \ge 0)
\end{align}

となります。

期待値

期待値  E(Y) は、


\begin{align}
\displaystyle E(Y) &= \int_{-\infty}^{\infty} y \cdot g(y) dy \\
&= \int_{0}^{\infty} y \cdot \frac{1}{\sqrt{2 \pi y}} \exp \left( - \frac{y}{2} \right) dy
\end{align}

で求めますが、 y = x^{2} dy = 2x \cdot dx であることを利用し、 x 0 \le x \le \infty の域値であること(累積分布関数の算出で偶関数の性質を使うときに、 x が負の領域を考慮して累積分布関数を2倍していること)に注意すると、


\begin{align}
\displaystyle E(Y) &= \int_{0}^{\infty} y \cdot \frac{1}{\sqrt{2 \pi y}} \exp \left( - \frac{y}{2} \right) dy \\
&= \sqrt{\frac{2}{\pi}} \int_{0}^{\infty} x^{2} \exp \left( - \frac{x^{2}}{2} \right) \\
&= \sqrt{\frac{2}{\pi}} \cdot \frac{1}{4} \sqrt{\frac{\pi}{\left( \frac{1}{2} \right)^{3} }} \\
&= 1
\end{align}

となります(ガウス積分の公式を利用)。

分散


\begin{align}
\displaystyle E(Y^{2}) &= \int_{-\infty}^{\infty} y^{2} \cdot g(y) dy \\
&= \int_{0}^{\infty} y^{2} \cdot \frac{1}{\sqrt{2 \pi y}} \exp \left( - \frac{y}{2} \right) dy \\
&= \sqrt{\frac{2}{\pi}} \int_{0}^{\infty} x^{4} \exp \left( - \frac{x^{2}}{2} \right) dx \\
&= \sqrt{\frac{2}{\pi}} \frac{3}{8} \sqrt{\frac{\pi}{\left( \frac{1}{2} \right)^{5} }} \\
&= 3
\end{align}

となるため、分散  V(Y) は、


\begin{align}
\displaystyle V(Y) &= E(Y^{2}) - E(Y)^{2} \\
&= 3 - 1 \\
&= 2
\end{align}

と求まります。

5.8

コインの投げた回数を  x 回として、表が出た回数について  x \to a の極限を取ることを考えます。

右極限  x \to a + 0 を取ると  P(X = a) となります。 ただし、累積分布関数は  G(a) = P(X \lt a) と定義されるため、 \displaystyle \lim_{x \to a + 0} G(a) = P(X \le a) \neq P(X \lt a) より、右連続ではありません。

一方で左極限  x \to a - 0 を取ると  P(X = a - 1) となります。 ここで、累積分布関数は  G(a) = P(X \lt a) と定義されるため、 \displaystyle \lim_{x \to a - 0} G(a) = P(X \le a-1) = P(X \lt a) より、左連続になります(コインを投げた回数が離散値を取ることに注意します)。

一方、累積分布関数を  F(x) = P(X \le x) と定義した場合は、同様の議論から左連続ではなく右連続になります。

以上のことから、 G(x) は右連続ではなく左連続になる点で  F(x) とは異なります。