1標本のt検定編
この第3章では、研究で最もよく見るt検定を勉強していこう。
ようじゅこのt検定はビジネスの場面でも論文でもよく出てきますが、論文系の発信者でもちゃんと理解している人は意外と少ない印象。これを理解するだけでもかなりの上位者になります
- 小サンプルで、サプリ群 vs プラセボ群で有意差があるかどうかを検定できる
- 小サンプルで、得られた値がある基準と同じかどうかを検定できる
- 小サンプルで、実際にサプリが効果を及ぼしたかどうかが検定できる
このt検定では、常に「得られたデータが何標準偏差分離れているか?」を見ていると考えるのが理解のコツ。
ようじゅつまり、標準誤差SE(=サンプル平均の分布の標準偏差)を用いて、下記のように書けます
$$ \frac{x-\mu}{SE} $$
ようじゅt検定では常に出発点はこの式。「得られた値は(サンプル平均の分布において)何標準偏差離れているんだろうか?をみている」と考えると迷子にならなくて済みます。
ということでこの講座では、常にこの”サンプル分布の標準化を表す式”をベースにして考えていこう。
おさらい:Z分布からt検定へ
ちょっとこの標準化っていうやつ?どんな意味だか忘れちゃった…
ようじゅ今一度標準化の式が何を表しているかを見てみることにしましょう
この標準化の式の意味は、サンプル分布(平均 $\mu$ 、標準偏差 $\frac{\sigma}{\sqrt{n}}$ )のグラフを、平均0・標準偏差1のグラフ(=Z分布)に作り変える作業を示していた。

なぜこんなことをするかというと、この式で得られた値は「平均から何標準偏差分離れているか?」をダイレクトに表しているから。
このことは、標準化の式を標準誤差SE(=サンプルの平均の分布の標準偏差)で書き直してみるとわかりやすい。
$$ \frac{X-\mu}{SE}=\frac{X-\mu}{\frac{\sigma}{\sqrt{n}}} $$
例えば得られた値が”2”であれば平均から標準偏差2個分離れているという意味だし、得られた値が”0.5”であれば平均から標準偏差0.5個分離れているという意味。
そして得られた値が1.96個分以上離れているとき…すなわち5%以下の少ない確率で入れないところに値が入ってしまったとき、前提となっている分布自体が間違っていると結論づける。

ようじゅこれは正規分布の性質のところで説明したので、覚えていない人は復習してください
これを帰無仮説を棄却するといい、これによって対立仮説を採用するのが”検定”。
例えばサプリに効果があるかを調べたいときは、サプリに効果がないという帰無仮説を設定する。
その前提のもとでこの結果が得られたと考えられる確率が十分に低い場合は、この帰無仮説を棄却して「サプリに効果がないとは言えない」という対立仮説を採用する。
ようじゅ何やらまどろっこしいやり方ですが、一度「効果がない」と仮説を立てて、この帰無仮説を棄却するというやり方を研究では取ります
ただし母標準偏差がわからないという欠点がある
しかしこのZ検定は、母標準偏差(σ)がわかっているという”ありえない条件”が必要だった。
そこで私たちは妥協案として、母標準偏差の代わりにその推定値であるサンプル標準偏差(s)を代入してみることにした。