サプリ群 vs プラセボ群を比較する独立2群のt検定②プール標準偏差を求めてみよう

前回までは「クレアチン vs プラセボ」を比較できる”独立2群のt検定”についてまとめた。

ようじゅ

今回は独立2群のt検定で使われる”プール標準偏差”について学んでいきます

プール標準偏差とは？

独立2群のt検定では、母集団の標準偏差の代わりとして”プール標準偏差”をつかう
プール標準偏差とは、いわゆる”重みつき平均”を使って求めた標準偏差

ようじゅ

プール標準偏差はt検定のところでしれっと出てきて「なんだこれ？」となりがちですが、”（重みつき）平均”として理解するとわかりやすいです

前回のおさらい「母集団の標準偏差の代わりに”サンプルの標準偏差”を使いたいが...」

ようじゅ

まずは少し前回のおさらいをしておきます

前回は、独立2群のt検定でつかう統計量tを下記の式から求めた。

$$ \frac{\bar{x}_1 - \bar{x}_2}{\sigma \cdot\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} $$

ようじゅ

これは今までと同じ「得られた値が平均から何標準偏差分離れているか？」をあらわしています

そしていつも通り「母集団の標準偏差がわからないからサンプルの標準偏差で代用する」ということをしようとするのだが、ここで問題がひとつ発生。

サンプルとプラセボ、どっちのグループの標準偏差を使えばいいの？

独立2群のt検定では、たとえばクレアチン群とプラセボ群のように、２つの”サンプル標準偏差”がある。

どちらか片方のサンプルを使うと”どちらを使うか”で結果が変わりかねないし、そもそも片方しか使わないというのは「もう片方のグループの情報を無視している」ことになるので統計学的にはナンセンス。

ようじゅ

結論をいうと”平均を取る”のですが、単純な平均ではなく”重みつき”の平均を使います

プール分散は（重み付き）平均である

プール分散はシンプルに平均

もう一度プール標準偏差の式を見てみよう。

$$ s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} $$

$\bar{x}_1$：クレアチングループの平均値
$\bar{x}_2$：プラセボグループの平均値
$n_1$：クレアチングループのサンプル数
$n_2$：プラセボグループの平均値

いやいや...これのどこが”平均”なん？？

ようじゅ

これが平均であることを理解するために、サンプル数が同じ $n$ のときに式がどうなるかを見てみましょう

$$s_p^2 = \frac{(n - 1)s_1^2 + (n - 1)s_2^2}{n + n - 2}$$

これを分子を (n-1) 、分母を 2 でくくると...

$$s_p^2 = \frac{(n - 1)(s_1^2 + s_2^2)}{2(n - 1)}$$

ここで分母と分子の (n-1) を約分する。

$$s_p^2 = \frac{s_1^2 + s_2^2}{2}$$

ようじゅ

これはクレアチン群とプラセボ群の分散を足して÷２しただけ。めでたく誰もが思うような平均になりました

サンプル数が違うときに”重み付け平均”になる

ではなぜこんなややこしい形をしているのかというと、これはプール標準偏差...というかプール分散がサンプルサイズで重み付けした平均だから。

ようじゅ

つまりサンプルサイズが大きい群の影響が大きくなるようになっています

たとえば極端な例として、クレアチン群のサンプル数が30人、プラセボ群のサンプル数が2人だけだったとしよう。

このとき、 $n_1=30, n_2=2$ となるのでプール標準偏差は下記のようになります。

$$s_p^2 = \frac{(30 - 1)s_1^2 + (2 - 1)s_2^2}{30 + 2 - 2}$$

これを計算して...

$$s_p^2 = \frac{29s_1^2 + 1s_2^2}{30}$$

ようじゅ

これは全体が30なのに対して、クレアチン群（ $n_1$ ）に29、プラセボ群に（ $n_2$ ）に1の重み付けをしていることになります

つまり、クレアチン群とプラセボ群の分散を29:1で重み付けしているということ。

え...でもサンプル数は30:2だから、各グループの分散も30:2で重み付けするんじゃないの？

ようじゅ

実は統計では情報量である”自由度”と呼ばれる概念を使うことが多いのですが、これもその自由度で重み付けしています。この”自由度”に関しては、次章全部使ってみっちり学びます

今は各群の自由度が「n-1」というサンプル数から"1"を引いた値であると知っておけばOK。

これはもう少し具体的にいうと、平均を求めるという作業で自由度が1失われているからこの計算式になる。

ようじゅ

自由度は後々で勉強するので、今は「とりあえずそういうなんだ」くらいの認識でOKです

重み付き平均とは？

これが重みつき平均って言われても...そもそも重みつき平均ってなんなん？？

ようじゅ

重みつき平均は、情報の信頼性に偏りがあるときに使われる平均。実は”普通の平均”も「すべてを”重み＝１”で信頼度が等しいと考えている平均」として理解できます

実は”ただの平均”も加重平均とみなせる

ようじゅ

たとえば30人のクラスを持つあなたが、クラスの平均身長を求めたいという場合を考えてみましょう

このとき、誰もが思うクラスの平均身長は下記だろう。

$$ \bar{x} = \frac{\text{身長}_1 + \text{身長}2 + \dots + \text{身長}{30}}{30} $$

「平均といえばこの式」と言えるくらいオーソドックスな式だが、これは実は”重みづけ平均”として理解することができる。

各人の身長に「同じ重み（1人分の情報量）」をつける
その合計を「全員分の情報量（30人）」で割る

ようじゅ

つまり私たちが普段使う平均というのは、「すべての値を同じくらい信頼できる」とした平均です

さらにこの式は下記のようにも書くことができる。

$$ \bar{x} = \frac{1}{30} \cdot \text{身長}_1 + \frac{1}{30} \cdot \text{身長}2 + \dots + \frac{1}{30} \cdot \text{身長}{30} $$

つまり全部の情報に $\frac{1}{30}$の重みを与えていることになる。

ようじゅ

日常生活では”情報の信頼性が等しくない”というパターンに遭遇することがほとんどないのですが、普通の平均を使うということは”全ての情報に等しい重み付けをしている”ということでもあります