Excel STDEV.P と STDEV.S はどっち?|母集団と標本の違いを総務省統計局の定義で整理
Excelの標準偏差関数は『P』と『S』の2系統があります。 総務省統計局の定義をもとに、どちらを選ぶべきかを整理します。
1. 母集団と標本の違い
STDEV.P と STDEV.S の選択は、データが『母集団そのもの』か『標本(サンプル)』かで決まります。 総務省統計局「なるほど統計学園」では、調査対象すべてを『母集団』、母集団から取り出した一部を『標本』と呼んでいます。
- ・母集団:知りたい全体(例:ある工場が生産した1万個の部品すべて)
- ・標本:そこから抜き取った一部(例:1万個から無作為に100個)
2. STDEV.P / VAR.P(÷n)の使い方
STDEV.P(Pは Population=母集団)と VAR.P は、データを母集団そのものとして扱い、偏差の二乗和をデータ数 n で割ります。
- ・分散 = Σ(xᵢ − x̄)² ÷ n
- ・標準偏差 = √分散
使う場面は、対象データが既に全数そろっている場合です。例:あるクラス40人全員のテスト点数、ある工場の1ロット全数測定、ある月のすべての日平均気温。
3. STDEV.S / VAR.S(÷n−1)の使い方
STDEV.S(Sは Sample=標本)と VAR.S は、データを標本として扱い、母集団の分散を推定する目的で n−1 で割ります。
- ・不偏分散 = Σ(xᵢ − x̄)² ÷ (n − 1)
- ・標本標準偏差 = √不偏分散
使う場面は、調査が全数ではなく抜き取りの場合です。例:抜き取り検査、世論調査、アンケートのサンプル、研究実験の被験者データ。
4. なぜ標本は÷(n−1)なのか
標本から母集団の分散を推定するとき、n で割ると平均的に過小評価することが知られています(偏った推定)。 そこで n − 1 で割ると平均的に偏りがゼロになり、より正しい推定値になります。これを『不偏推定量』と呼びます。
直感的には、標本平均は標本データから計算されるため『標本自身に最もフィット』してしまい、母集団全体に対しては自由度を1つ消費しています。 失われた1つの自由度を差し引くため、n ではなく n − 1 で割ります。
5. 旧STDEV関数との対応
Excel 2010 以前は STDEV と STDEVP の2系統でしたが、2010 以降は新名称が標準です。互換性のため旧関数も使えますが、新規ファイルでは新名称推奨です。
- ・STDEV → STDEV.S(標本標準偏差)
- ・STDEVP → STDEV.P(母集団標準偏差)
- ・VAR → VAR.S(不偏分散)
- ・VARP → VAR.P(母分散)
Googleスプレッドシートも同じ命名規則(STDEVP / STDEV)で揃っており、計算結果は完全に同じです。
6. 関連ツール・記事
- ・平均・標準偏差計算ツール:数値貼って即算出
- ・平均と中央値の使い分け:代表値の選び方
- ・標準偏差の読み方:ばらつきの指標
- ・パーセント計算:割合・増減率