統計学:どうしてもわからない…ヒストグラムと度数分布および正規分布の解説

閲覧回数 閲覧回数
1 78 16 625
2 126 17 606
3 156 18 483
4 234 19 377
5 215 20 370
6 304 21 587
7 484 22 667
8 544 23 643
9 566 24 756
10 545 25 505
11 478 26 436
12 258 27 399
13 225 28 611
14 373 29 679
15 620 30 575
31 565

Wikipediaのヒストグラムの日本語版記事の閲覧回数の図表。ここからヒストグラムと正規分布について簡潔にここで解説する。ヒストグラムというのは度数(任意に指定した範囲の基準)にいくつその回数が入るかということを示したグラフである。度数累計とは全く違うので注意が必要だ。

これは次の度数分布表に基づいて作られているわけだ。繰り返すが、度数累計のグラフと混同しがちであり、また、度数分布の概念とこんがらがってわかりにくいことこのうえないので、この際にしっかりと覚えておくようにするべきだ。

閲覧回数 その範囲内に収まっている日数
0-99 1
100-199 2
200-299 4
300-399 5
400-499 4
500-599 7
600-699 7
700-799 1

セットで覚えよう。ついでに言っておくと、度数累計のグラフは同ページより引用させていただくとこのようになる。累計とヒストグラムの概念がコンセプチュアルに理解できず、混同してしまうことはしばしばあると個人的には思うので注意しておきたい。


累計のほうはどっちにしたって、右肩上がりになるのは当たり前だ。検定で間違う一番基本的なところだろう。 一方で正規分布についてはいくつもの理解が必要である。左右対称で、理想的な確率密度関数を図にしたもののことをいうわけだ。平均をmにとって、標準偏差が理想的な値をとるとき、この確率密度関数の表す図を正規分布という。すなわち上図のヒストグラムは実は正規分布を表したものから作られたヒストグラムに他ならない。

このように概念としての正規分布は「なだらかで左右対称な曲線を得る山なりの分布図」ともいえる。この分布図は社会のあらゆるところで現れる性質でもあるので、このように概念的に理解することが重要だ。例えば、水が落ちるとき、水滴が影響を及ぼす図はこの正規分布に近いのである。これが概念的な統計の理解である。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA