Ia ora na!
今日は平均について。
仕事柄、多くの数字を分析します。
その際、平均値を使うことがあるのですが、注意しなければならないことがあります。
それは何か?
平均っていうと、全ての数字を足して全体の個数で割って求めますよね。
しかし、「平均」には他に2つの測定法があるんです(全部で3つ)。
・平均値(average)
・中央値(median)
・最頻値(mode)
上記で述べた一般的なものは、平均値(average)です。
これはすべての値が反映される反面、飛び抜けた値が含まれるとその異常値に引っ張られてしまいます。
中央値( median)は文字通り真ん中の値。
極端な値の影響を受けづらい反面、ピンポイントで真ん中だけを表しているので、データ全体の変化や比較には向かないことがあります。
最頻値(mode)はデータの中で最も多く観察される値。
これも極端な値の影響を受けづらい反面、個数が少ない場合は使えなかったり、区間の幅によって結果が変わることもあります。
グラフで見てみると・・・
このようにデータが左右対象の山の形に分布している場合(正規分布)は、平均値も中央値も最頻値も等しくなります。
グラフの真ん中のデータが一番多いので最頻値。
左右対象にデータがあるので、平均値と中央値もグラフの真ん中になります。
しかし、このような場合には、平均値・中央値・最頻値が等しくなるとは限りません。
平均値は「データを代表している」感じでついつい考えてしまいがちですが、データの分布の仕方によっては捉え方が全然変わってきます。
中央値・最頻値も見ておかなければなりません。
このことを理解して数字を分析しないと、判断や意思決定を間違えてしまうのです。
次回は、具体的な事例を元に、平均についてみていきたいと思います。
それではまた。
Mauruuru