【統計学入門(東京大学出版会)】第10章 練習問題 解答
東京大学出版会から出版されている統計学入門(基礎統計学Ⅰ)について第10章の練習問題の解答を書いていく。
本章以外の解答
本章以外の練習問題の解答は別の記事で公開している。
必要に応じて参照されたい。
10.1
誤差 の分布が であるから、その期待値は となる。 したがって、測定値の標本分布 の期待値は である。
一方で分散 は、
となる。
以上から、測定値の標本 の分布は と求まる。
を に標準化する場合、
となるから、両側の確率を求めることに注意すると、
を満たす確率を求めればよい。 上記の確率を求めるPythonプログラムは次のとおりである。
from scipy.stats import norm print(2 * norm.sf(x=3, loc=0, scale=1))
上記のプログラムを実行すると、次の結果が得られる。
0.0026997960632601866
10.2
測定回数を とすると10.1と同様、期待値は 、分散 は、
であるから、標準化により、
を得る。
したがって、
から、
を満たす を求めればよい。
なお、この式を満たす は、次のPythonプログラムによって求められる。
from scipy.stats import norm print(norm.ppf(q=1-0.05, loc=0, scale=1))
結果は、
1.6448536269514722
である。したがって は、
より と求まるから、測定を28回以上繰り返す必要がある。
10.3
i)
正規母集団から標本を抽出するため、その標本平均の標本分布は に従う。 したがってその標準化、
は標準正規分布 に従う。
したがって標準平均 が3と6にある確率は、
で求めることができる。これをPythonプログラムを使って求める。
from scipy.stats import norm x1 = 0.5 - norm.sf(x=0.8165, loc=0, scale=1) x2 = 0.5 - norm.sf(x=1.633, loc=0, scale=1) print(x1 + x2)
上記のプログラムを実行すると、
0.7416583899007179
が得られる。
ii)
標本分散 は、 分布と次のような関係がある。
したがって が を超える確率が0.05であるという条件より、
が得られるから、この式を満たす自由度 の の値を求める。
from scipy.stats import chi2 print(chi2.ppf(q=1-0.05, df=9))
上記のプログラムより、以下の結果が得られる。
16.918977604620448
したがって、
を満たす は、28.198となる。
10.4
母集団の分散が未知であるから、スチューデントのt分布を利用する。
これを用いて、
この式を満たす自由度 の の値を求める。
from scipy.stats import t print(t.ppf(q=1-0.01, df=14))
より、
2.624494067560231
と求まる。 したがって、
を満たす の値を求めればよく、その値は である。
10.5
2標本問題である。 いずれの母集団の母平均と母分散が既知であるから、標本平均 と の差は正規分布、
に従う。
各値を代入すると、
が得られる。
10.6
母分散が既知のときに2つの標本分散の比を求めるときは、F分布
を利用するのが便利である。
この式を満たす自由度 の の値を求める。
from scipy.stats import f print(f.ppf(q=1-0.05, dfn=9, dfd=7))
より、
3.6766746989395105
と求まる。
したがって、
を満たす の値を求めればよく、その値は である。
10.7
i)
母平均 、母分散 とすると、標本平均の分布は となる。 したがって標準化、
を考えると、
なお、最後は次のPythonプログラムによって求めた。
from scipy.stats import norm print(2 * norm.sf(x=0.8, loc=0, scale=1))
ii)
自由度が であることに注意してスチューデントのt分布
を用いると、
なお、最後は次のPythonプログラムによって求めた。
from scipy.stats import t print(2 * t.sf(x=0.8, df=9))
iii)
自由度が であることに注意して 分布
を用いると、
なお、最後は次のPythonプログラムによって求めた。
from scipy.stats import chi2 print(1- (chi2.sf(x=9/2, df=9) - chi2.sf(x=18, df=9)))
iv)
2標本問題である。
自由度が のスチューデントのt分布
を用いると、母平均が等しい(すなわち、)ことに注意して、
なお、最後は次のPythonプログラムによって求めた。
from scipy.stats import f from math import sqrt print(f.sf(x=3 * sqrt(5), dfn=9, dfd=9))
v)
2標本問題である。
自由度が のF分布
と母分散が等しい ことを用いて、
なお、最後は次のPythonプログラムによって求めた。
from scipy.stats import f print(f.sf(x=3, dfn=9, dfd=9) + 1 - f.sf(x=1/3, dfn=9, dfd=9))
10.8
母集団分布が2次元の正規分布であるから、z変換を行った結果が標準正規分布になることを用いる。
このとき、
が確率0.95の範囲に収まるような を求めることになる。 すなわち、
を満たせばよい。 なお標準正規分布で確率0.95(上側確率0.05)となる値は、次のPythonプログラムによって求めた。
from scipy.stats import norm print(norm.ppf(q=(1-0.95)/2, loc=0, scale=1))
ここで、 であるから、
と求まる。 したがって、
一方で、
であるから、
が得られ、 と求まる。
10.9
i)
(a)
自由度nの 分布の定義は、 を標準正規分布に従う確率変数として、
である。 したがって、自由度1の 分布は、
となるが、 分布は上側確率のみを与えるので、このための補正を行うと、
が得られる。
(b)
本書より、自由度 のスチューデントのt分布の2乗 は、F分布 に従う。 ただしt分布は両側確率を与えるものである一方、F分布は上側確率のみを与えるから、(a)の議論と同様に補正を行って、
が得られる。
(c)
であるから、 が十分に大きい値であると考えることができる。 つまり、標本数を として考えてよく、このとき標本分散 は母分散 に近づく。 したがって、
ii)
i)の各値を求めるPythonプログラムを次に示す。
from scipy.stats import norm, chi2, t, f alpha = 0.05 k = 120 print("=== (a) ===") print("Z2: {}".format(norm.ppf(q=1-alpha/2, loc=0, scale=1)**2)) print("chi2: {}".format(chi2.ppf(q=1-alpha, df=1))) print("=== (b) ===") print("t2: {}".format(t.ppf(q=1-alpha/2, df=k)**2)) print("F: {}".format(f.ppf(q=1-alpha, dfn=1, dfd=k))) print("=== (c) ===") print("t: {}".format(t.ppf(q=1-alpha, df=k))) print("Z: {}".format(norm.ppf(q=1-alpha, loc=0, scale=1)))
上記のプログラムを実行すると、次のような結果が得られる。
=== (a) === Z2: 3.8414588206941254 chi2: 3.841458820694124 === (b) === t2: 3.9201244088524523 F: 3.9201244089699054 === (c) === t: 1.6576508993473795 Z: 1.6448536269514722