平均と中央値の使い分け|年収・住宅価格・テスト点数で違う『代表値』の選び方
『平均』と聞くと最も身近に思える指標ですが、年収や住宅価格の話では『中央値』が使われます。 総務省統計局の代表値解説を元に、なぜ違いが出るのか・どう選ぶのかを整理します。
1. 代表値とは
総務省統計局「なるほど統計学園」は、集団の中心的傾向を示す値を『代表値』と呼んでいます。 代表値は一般に平均値が使われますが、分布の形によっては最頻値や中央値を使う方が実感に近くなります。 つまり代表値は1つではなく、データの性質に合わせて選ぶものです。
- ・平均値(Mean):すべて足してデータ数で割る
- ・中央値(Median):並べて真ん中の値
- ・最頻値(Mode):最も多く出てくる値
2. 平均値の特徴と弱点
平均値は「すべてのデータを足してデータ数で割る」ため、全体を素直に反映する代表値です。 ただし、極端な大小値(外れ値)が混じると、その値に強く引っ張られるのが弱点です。 総務省統計局も「平均値は三つの指標の中で最も影響を受ける」と明記しています。
例えば10人の年収が「300万円×9人+3億円×1人」なら、平均は3,270万円。しかし大多数は300万円であり、平均値は実感とかけ離れます。
3. 中央値が使われる代表的なデータ
- ・世帯年収・所得:高所得層が分布を歪めるため厚生労働省は『平均』と『中央値』を両方公表
- ・住宅価格・賃料:高級物件が引き上げるため中央値で『真ん中の物件価格』を示すのが普通
- ・賃金統計:国税庁の民間給与実態統計は中央値も併記
- ・退職金・貯蓄額:高額者が混ざる分布で中央値を併用
いずれも「分布が左に寄り、右側に長い裾を引く」という特徴を持っています。こうしたデータでは平均より中央値の方が『普通の人の値』に近くなります。
4. 平均が使われる代表的なデータ
- ・テストの点数:分布が左右対称に近く外れ値も限定的
- ・身長・体重(成人):おおむね正規分布で平均が実感とずれにくい
- ・気温・降水量の月平均:気象庁の正式公表値も平均
- ・製品の測定値:品質管理では平均と標準偏差を組み合わせる(3σ管理)
これらは正規分布(左右対称・ベル型)に近いか、外れ値が出にくいデータです。平均と中央値・最頻値がほぼ一致するため平均で十分です。
5. 分布の形と代表値の関係
総務省統計局の解説によれば、データの分布に歪みがあると、平均・中央値・最頻値の順に並びが変わります。
- ・右に裾が長い分布(年収など):最頻値 < 中央値 < 平均値
- ・左に裾が長い分布:平均値 < 中央値 < 最頻値
- ・左右対称(正規分布):3つがほぼ一致
つまり3つの代表値の並びを見れば、分布の歪み具合を直感的に判断できます。
6. 関連ツール・記事
- ・平均・標準偏差計算ツール:数値を貼って一括算出
- ・標準偏差の読み方:ばらつきの指標を整理
- ・STDEV.P と STDEV.S:母集団と標本の違い
- ・パーセント計算:割合・増減率