中央値を計算する

中央値とは、データを小さい順・大きい順に並べたとき、真ん中にくる値のことです。

例えばAグループとBグループで物を作る作業を10回行い、その完成数を記録したとします。平均値はAグループが7、Bグループは8.3です。一方で、中央値を見てみると、Aグループは7.5、Bグループは10となります。

Aグループは、平均値(7)と中央値(7.5)で大きなさはありません。一方で、Bグループは平均値(8.3)と中央値(10.0)で差が大きい印象です。そこでグループBの完成数を見てみると、10回中6回は10個作成しているものの、最初の2回の完成数が4と5と少ないです。このように、データ中に極端に小さな値や大きな値がある場合、平均値は実際の中心に近い値よりも低く(高く)なることがあります。しかし、中央値はその影響をあまり受けず、データ本来の中心地に近い値を知ることができます。

中央値の計算手順は、以下の通りです。

  1. 空のセルを選択する
  2. =MEDIAN()と入力する
  3. ()内に、中央値を計算したいデータの範囲を入力する
    1. 例:=MEDIAN(B2:B11)
  4. Enterを押す

中央値から推し量れることと注意が必要なこと

以下の点などを推し量ることができます

  • 代表性:集めたデータが全体としてどのような傾向にあるのか
  • 相対性:比較する基準がある場合、集めたデータが基準と比べて値が高いのか低いのか
  • 外れ値:極端に大きな値や小さな値の影響を受けにくい

以下の点などに注意が必要です

  • 偏り:極端に高い値や低い値しかない場合、中央値はデータの実体を反映しない
  • 分布:データがどのような分布をしているのか(偏っているのかいないのかなど)はわからない
参考文献・URL
  • 南風原 朝和著 「統計学の基礎(有斐閣アルマ)」有斐閣