前回の講座では、サンプル平均を使って母集団の平均を推測する方法をまとめた。
今回は統計初学者が必ずつまづくと言っても過言ではない”母集団の分散”と”母集団の標準誤差”について紹介する。
ようじゅ
ここは自分もはじめて勉強したときは思いっきりつまずきました。
この回で学ぶこと
- 母集団の分散と標準偏差は、どうやって求めるのか
- 母集団の分散と標準偏差において、分母がn-1になる理由
- ぶっちゃけ、サンプルの分散と母集団の分散は使い分けなくてもいい説
ここでは混合を避けるためにサンプルの分散をサンプル分散(Sample Variance)、母集団の分散(の推定値)を母分散(Population Variance)と呼んで区別することにする。
ようじゅ
同様に母集団の平均と標準偏差を”母平均”と”母標準偏差”、サンプルの平均と標準偏差を”サンプル平均”と”サンプル標準偏差”と呼ぶことにします。
サンプルと母集団の分散は分母が違う
サンプル分散(Sample Variance)
まず以前紹介したバラツキの指標である分散は、下記の式で表される。
$$ s^2=\frac{1}{n}\sum_{i=1}^n(\mathrm{1RM}_i-\overline{\mathrm{1RM}})^2 $$
ようじゅ
これは意味としては、「平均からの距離(の二乗)を足して、サンプルの数で割ったもの」です。
プラスとマイナスが打ち消し合わないように二乗して、一つあたりの”平均からの距離の二乗”にしたものが分散の正体。
ようじゅ
これがサンプルの分散である”サンプル分散”の式です。
母分散(population Variance)
そして母集団の分散を $\sigma$ として、その推定値である $\hat{\sigma}$ は次の式で表される。
$$ \hat{\sigma}^2=\frac{1}{n-1}\sum_{i=1}^n(\mathrm{1RM}_i-\overline{\mathrm{1RM}})^2 $$
ここで母分散では分母がnではなくn-1になっていることに注意。
なぜn-1になっているかというと、この計算式が”最も母分散をうまく推測できる”とわかっているから。
ようじゅ
逆に言えば分母をnにしてしまうと、母集団の分散を過小評価してしまうことがわかっています。
分母をn-1にする理由(直感的理解)
分母をn-1にする理由、それは直感的に言うならば「サンプル平均というものは、母平均よりもサンプルの中央に位置する」から。