分からなくなるのでまとめておこう_平均値と、中央値
こんな方に読んでほしい!
◎静岡市近郊で営業中
◎従業員数30名以下
◎活気ある職場づくりを通して業績アップにつなげたい
◎統計データを読んでいて疑問があった
◎ご年齢が30-50代の代表者様
こんにちは。社会保険労務士の杉浦です。
前回の続きで、統計にまつわるお話。
データを合計して、その頭数で割るという平均。これには意外な落とし穴があることをご存知でしょうか?
今回は平均値と”中央値”、その違いについて、まとめていきましょう。
◎平均値と中央値の違い
平均値は、データの合計をデータ数で割ったものです。
例えば、数値データが20,30,40,50,60の場合、平均値は(20 + 30 + 40 + 50 + 60)÷ 5 = 40となります。
中央値は、データを小さい順に並べた際に中央に位置する値です。同じデータの場合、中央値は40です。
◎平均値と中央値の使い分け
上述の紹介の時点では、同じ数字になっています。何が問題になって来るでしょうか?
友達との5日間の遊び時間(分)が30,40,40,50,200だとします。(金曜日、遊び過ぎでは?)
もし、この時間を平均値で計算すると、(30 + 40 + 40 + 50 + 200)÷ 5 = 72となります。
しかし、最後の「200」が異常に大きいため、実際の遊び時間とはかけ離れた平均値が得られてしまいます。統計学では、この200と飛びぬけてしまっている数字を「外れ値」と言います。
一方で、中央値はデータを並び替えてみると30,40,40,50,200から中央に位置する値が「40」です。この中央値は他のデータと比較しても大きく影響されず、実際の遊び時間をより正確に表しています。
◎中央値の重要性
データに外れ値(異常値)がある場合、平均値は外れ値に引っ張られてしまい、実際の傾向が歪められます。そのため、特にデータにバラつきがある場合には、中央値が有用です。外れ値の影響を受けず、データ全体の中心的な値を示してくれるからです。
平均を取るという計算は一般的で、使い慣れているがために頼りにしがちなところもありますが、例えばビジネスの世界。
12か月の”平均”では目標売上達成できていても、繁忙期だけ飛びぬけて忙しかったから達成できた売上かもしれません。
繁忙期以外は経常収支赤字でいいのでしょうか?また、繁忙期飛びぬけて頑張ったことで、諸経費も伴って多くなっていないでしょうか?
数字のマジックに正しく向き合えるようになれるといいですよね。
Comments