平均って何?(1)

Ia ora na!
今日は平均について。

仕事柄、多くの数字を分析します。
その際、平均値を使うことがあるのですが、注意しなければならないことがあります。
それは何か?

平均っていうと、全ての数字を足して全体の個数で割って求めますよね。
しかし、「平均」には他に2つの測定法があるんです(全部で3つ)。
・平均値(average)
・中央値(median)
・最頻値(mode)

上記で述べた一般的なものは、平均値(average)です。
これはすべての値が反映される反面、飛び抜けた値が含まれるとその異常値に引っ張られてしまいます。

中央値( median)は文字通り真ん中の値。
極端な値の影響を受けづらい反面、ピンポイントで真ん中だけを表しているので、データ全体の変化や比較には向かないことがあります。

最頻値(mode)はデータの中で最も多く観察される値。
これも極端な値の影響を受けづらい反面、個数が少ない場合は使えなかったり、区間の幅によって結果が変わることもあります。

グラフで見てみると・・・

f:id:ko-manage:20210119164049p:plain

このようにデータが左右対象の山の形に分布している場合(正規分布)は、平均値も中央値も最頻値も等しくなります。
グラフの真ん中のデータが一番多いので最頻値。
左右対象にデータがあるので、平均値と中央値もグラフの真ん中になります。

f:id:ko-manage:20210119164509p:plain

しかし、このような場合には、平均値・中央値・最頻値が等しくなるとは限りません。

平均値は「データを代表している」感じでついつい考えてしまいがちですが、データの分布の仕方によっては捉え方が全然変わってきます。
中央値・最頻値も見ておかなければなりません。
このことを理解して数字を分析しないと、判断や意思決定を間違えてしまうのです。

次回は、具体的な事例を元に、平均についてみていきたいと思います。

それではまた。
Mauruuru