手軽屋
ツール一覧

平均と中央値の使い分け|年収・住宅価格・テスト点数で違う『代表値』の選び方

『平均』と聞くと最も身近に思える指標ですが、年収や住宅価格の話では『中央値』が使われます。 総務省統計局の代表値解説を元に、なぜ違いが出るのか・どう選ぶのかを整理します。

1. 代表値とは

総務省統計局「なるほど統計学園」は、集団の中心的傾向を示す値を『代表値』と呼んでいます。 代表値は一般に平均値が使われますが、分布の形によっては最頻値や中央値を使う方が実感に近くなります。 つまり代表値は1つではなく、データの性質に合わせて選ぶものです。

2. 平均値の特徴と弱点

平均値は「すべてのデータを足してデータ数で割る」ため、全体を素直に反映する代表値です。 ただし、極端な大小値(外れ値)が混じると、その値に強く引っ張られるのが弱点です。 総務省統計局も「平均値は三つの指標の中で最も影響を受ける」と明記しています。

例えば10人の年収が「300万円×9人+3億円×1人」なら、平均は3,270万円。しかし大多数は300万円であり、平均値は実感とかけ離れます。

3. 中央値が使われる代表的なデータ

いずれも「分布が左に寄り、右側に長い裾を引く」という特徴を持っています。こうしたデータでは平均より中央値の方が『普通の人の値』に近くなります。

4. 平均が使われる代表的なデータ

これらは正規分布(左右対称・ベル型)に近いか、外れ値が出にくいデータです。平均と中央値・最頻値がほぼ一致するため平均で十分です。

5. 分布の形と代表値の関係

総務省統計局の解説によれば、データの分布に歪みがあると、平均・中央値・最頻値の順に並びが変わります。

つまり3つの代表値の並びを見れば、分布の歪み具合を直感的に判断できます。

6. 関連ツール・記事

平均・標準偏差を計算する