論文で最頻出のt検定への架け橋「Z検定とt検定、標準正規分布」
前回の講座では、「サンプルの分布が正規分布になるよ!」ということを紹介した。
ここからは一歩進んで、正規分布を使った”検定”というものをやってみよう。
ようじゅ研究でよく出てくるt検定...をやりたいところですが、まずはZ検定というものをやってみます
ちなみにZ検定というのは、”母集団の標準偏差”というものが分からなければ検定ができない。
つまり、現実には絶対知り得ない値であるものが前提になっているので、Z検定を研究で使うことはまずない。
ようじゅしかしZ検定はt検定の哲学を理解するために超重要。そのため統計学の教科書でも出てくることが多めです
- Z検定を使って、たとえば「日本人のベンチプレス1RMは世界と同じ水準なのか?」を検定できる
- Z検定の問題点から、歴史上の偉人がどのようにt検定を生み出したのか?を追体験できる
- 結果として、論文で最頻出の”t検定”を本質から理解できる
実際の流れとしては、下記のようになる。
- Z検定で使う”正規分布の標準化”を学ぶ
- 標準正規分布を使ってZ検定をする
- t検定とのつながりを見る
ようじゅまずは正規分布の標準化というものを学んでから、実際にZ検定について学んでいきます。そして最後に、いよいよ論文で最頻出のt検定についても片足を突っ込みます
Z検定の前に必要な知識:標準正規分布
正規分布を”共通の規格”で直したのが、標準正規分布
前回の章で正規分布というものを学んだ。
ようじゅこの正規分布はなだらかな山のような形をしていて、平均±標準偏差に約68%、平均±95%に約95%のサンプルが含まれていることがわかっています

この標準正規分布は、平均から左右均等にサンプル数が減っていくというわかりやすい性質。
実際に身長など、この正規分布を仮定して大丈夫なパターンも多い。
ようじゅさらには、中心極限定理によって”サンプル平均”が正規分布になることがわかっているので、かなり重要なものになります
しかし一方で「平均±標準偏差に約68%、平均±95%に約95%のサンプルが含まれている」という性質は、不便な部分がある。
それが分布によって平均も標準偏差も違うので、共通の物差しで比較しづらいということ。
ようじゅたとえば平均が170cm・標準偏差が5cmの身長の正規分布であれば165~175cmに68%が入り、平均が70kg・標準偏差が7kgの正規分布であれば63kg~77kgに68%が入るといった具合です
そこで出てくるのが”標準化”という操作。
標準化というのはなにかというと、正規分布をすべて「平均が0・標準偏差が1の正規分布」に書き換える作業。
ようじゅすべて平均が0・標準偏差が1の正規分布で考えたら、同じ物差しで測れて便利じゃね?というのが標準正規分布の発想です
たとえば標準正規分布に直してさえしまえば、-1~1に入るサンプルは68%とすぐさまわかる。
この特別な正規分布を”標準正規分布”と呼び、この平均が0・標準偏差が1の分布に変換することを”標準化”と呼ぶ。
ようじゅそしてこの標準正規分布のことを"Z分布”と呼んだりします
標準化とZスコア
ようじゅこのZ分布と並んで大事なのが、Zスコアと呼ばれるものです。これは「平均からどれだけ離れているか?」を表しています
このZ分布とZスコアは、実は式が同じ。
それゆえに混同しやすい概念なので、少し丁寧に説明してみよう。
Z分布は、すべての観測値に対して標準化を行ったもの
標準化とは、正規分布を「平均0・標準偏差1のZ分布へ変換」すること。
そしてこれは、下記のような式で表される。
$$Z = \frac{X - \mu}{\sigma}$$
ようじゅまず分子の”観測値 - 平均”は、平均0への移動を表しています
たとえば平均5の正規分布だとしたら、 分子の $X - \mu$ という計算をすべての観測値Xに関して行うと、元の正規分布は平均は0のグラフに移される。

なぜなら観測値が平均ど真ん中の5であれば、計算の結果は"5 - 5 = 0"となる。
仮に6であれば、5を引いて1...というようにすべての値に関して5を引くと、分布は丸ごと左にずれて平均0の正規分布になることがわかる。
ようじゅそしてこのグラフを”元の標準偏差”で割ることによって、標準偏差が1のグラフになります

実はこのこと自体は、数学的には簡単に示すことができる。
なぜなら標準偏差には、「元のデータをk倍したグラフは、標準偏差もk倍になる」という性質があるから。
つまり元のデータで標準偏差が $\sigma$ なら、 $\frac{1}{\sigma}$ 倍すれば標準偏差は1になる。
ようじゅとはいえこの計算の意味を知らないとなんだかモヤモヤすると思うので、これが何をしているのかを解説します
Z分布とは、「標準偏差を基準に世界を構築し直したもの」
ようじゅこれはいわば、元の単位に関係なく同一の尺度で見ることにするということでもあります
たとえば身長(平均170cm・標準偏差5cm)と体重(平均70kg・標準偏差7kg)を平行移動だけしたものを考えよう。