無限壁破り駆動開発 <colspan=∞>

テーマは北海道, オープンデータ, Web技術, HTML5, d3.js, カメラ, 韓国語, Javascript, Ruby, Python

区間推定法の信頼度が実際の推定結果と合致するかを確かめる

統計解析における検定・推定の勉強中に出てきた母平均の区間推定法の信頼度を理解するために行った実験の備忘録。具体的には区間推定法の信頼度が実際の推定結果と合致するかを確かめた。

正規分布からサンプルしたデータでの母平均の区間推定を何度も行い、その中に真の母平均が含まれる確率を計算するスクリプトを実装した。

スクリプト

import random
import math
import numpy as np
from scipy.stats import norm
conf_results = []

mu0 = 20.0 # 母平均
sig0 = 10.0 # 母分散
N = 1000 # データサンプル数
trial = 1000 # 母平均推定試行回数
for i in range(trial):
    # 正規分布からデータをサンプルする
    data = np.random.normal(loc=mu0, scale=sig0, size=N)
    # サンプル集合の平均値を求める(母平均推定)
    mean = np.mean(data)
    # 母平均推定の信頼区間(95%)を求める
    R = norm.interval(0.95,loc=mean,scale=sig0/math.sqrt(N))
    # 信頼区間に真の母平均が含まれるか否かを評価し、結果を出力する
    conf_results.append( R[0]  < mu0 < R[1] )
# サンプルデータ群の正解率(実測の信頼度)
print float(sum(conf_results)) / float(trial)

実行結果

0.946

設定した信頼度95%とほぼ一致している。