今回レビューするのは、「Excelで考える統計学」山中 馨、天谷 永、望月 雅光 著 創成社です。
本書は、統計学の本ですが、その実例をExcelで検証して理解しようという本です。また、他の本とはことなり、「例題」ー「回答」形式になっているのも特徴です。
正規分布
「正規分布」は以前にもやっていますが、ここでは正規分布の使い方・運用を主眼において説明して行きたいと思います。
例題:
日本でのメタボリックシンドロームの診断基準は男性ではウエスト周り85cm以上である。
いま,成年男性のウエスト周りの分布は平均μ=78.0cm,標準偏差σ=6.5cmの正規分布に従うとき,メタボリックシンドロームと診断される男性の割合はどれ程か。
下図にこの日本の成年男性のウエスト周りの正規分布図を示します。

標準正規変数 z は、以下の式で定義されます。
z = (x-μ)/σ
この式を適用することで、zは正規分布に従う指標になります。下図に標準正規分布を示します。

診断基準 x=85.0 とすると標準正規変数zは次の式に従って、μ=78.0, σ =6.5を代入すると z= 1.076923 となります。したがって正規分布のzより大きい割合は次のように求められます。
つまり、ウエスト周り x=85cm は、標準正規分布に当てはめると、横軸 z = 1.076923になります。例題で問うているメタボリックシンドロームは、ウエストサイズ x = 85cm(z = 1.076923)以上になりますから、赤線の右側の部分の面積になります。

これは、Excel関数の「NORM.S.DIST(z,TRUE)」からもとめられます。「NORM.S.DIST(z,TRUE)」は、「-∞~ NORM.S.DIST(z,TRUE)」を現しますので、赤線の右側の面積は、「1 – NORM.S.DIST(1.076923)」になります。
この値を計算すると、「1 – 0.859245 = 0.140756」になりますので、日本の成人男性でメタボリックシンドロームと診断される人の割合は、約14%になります。

順列
順列とは、いくつかのものを順序をつけて並べることです。英語では、”Permutation”というため、順列を現す記号は、「P」になります。
例:
5個から3個選んで順序の総数は、
5P3 = 5 × 4 × 3 = 60 個
になります。

コメント