中央値を計算する
中央値とは、データを小さい順・大きい順に並べたとき、真ん中にくる値のことです。
例えばAグループとBグループで物を作る作業を10回行い、その完成数を記録したとします。平均値はAグループが7、Bグループは8.3です。一方で、中央値を見てみると、Aグループは7.5、Bグループは10となります。
Aグループは、平均値(7)と中央値(7.5)で大きなさはありません。一方で、Bグループは平均値(8.3)と中央値(10.0)で差が大きい印象です。そこでグループBの完成数を見てみると、10回中6回は10個作成しているものの、最初の2回の完成数が4と5と少ないです。このように、データ中に極端に小さな値や大きな値がある場合、平均値は実際の中心に近い値よりも低く(高く)なることがあります。しかし、中央値はその影響をあまり受けず、データ本来の中心地に近い値を知ることができます。
中央値の計算手順は、以下の通りです。
- 空のセルを選択する
- =MEDIAN()と入力する
- ()内に、中央値を計算したいデータの範囲を入力する
- 例:=MEDIAN(B2:B11)
- Enterを押す
中央値から推し量れることと注意が必要なこと
以下の点などを推し量ることができます
- 代表性:集めたデータが全体としてどのような傾向にあるのか
- 相対性:比較する基準がある場合、集めたデータが基準と比べて値が高いのか低いのか
- 外れ値:極端に大きな値や小さな値の影響を受けにくい
以下の点などに注意が必要です
- 偏り:極端に高い値や低い値しかない場合、中央値はデータの実体を反映しない
- 分布:データがどのような分布をしているのか(偏っているのかいないのかなど)はわからない
参考文献・URL
- 南風原 朝和著 「統計学の基礎(有斐閣アルマ)」有斐閣