工程能力(Cpk)を算出する際に、「サンプル数をいくつにすればよいのか?」皆さんも一度は考えることがあったのではないでしょうか。 お客様から明確な指示がある場合や、社内で決められている場合には困ることはないと思いますが、現実には慣習的に n=30やn=20で行っていることが多いと思います。その疑問についてわかりやすく解説します。
慣習的にn=30で工程能力を算出していて、お客様から n=100 を求められたときに、
・ うちの n=30 は本当に妥当なのか
・ n=100 を要求される根拠は何なのか
・ 測定が大変なのでサンプル数を減らしたいが、どこまで許されるのか
と疑問を感じた経験がある方も多いと思います。
本コラムでは、サンプル数が標準偏差の推定にどのような影響を与え、その結果として Cpk がどれだけブレるのかを統計的に、かつ現場目線で解説します。
標準偏差のブレは管理図にも影響します。
管理図の異常パターンや使い分けについては管理図とは? 7つの異常判定ルールと使い方を図解でわかりやすく解説 が参考になります。
工程能力指数 Cpk は、
・ 規格幅(固定)
・ 標準偏差(推定値)
の2つで決まります。
規格幅は変わりませんから、サンプル数が変わると影響を受けるのは標準偏差だけ です。
標準偏差は「母集団のばらつき」を推定した値ですが、サンプル数が少ないほど推定誤差が大きくなります。
つまり、サンプル数の問題=標準偏差の推定精度の問題
→ 結果として Cpk の信頼性にも影響する
という構造です。
工程能力指数(Cp・Cpk)の基本的な考え方については、品質保証で使われる工程能力指数とは にまとめています。
Cpk の前提となる概念を整理したい方におすすめです。
標準偏差の推定値には必ず誤差があります。
その誤差の幅は 信頼区間(Confidence Interval) を使うと求められます。
品質管理では一般的に 95%信頼区間 が使われます。
ここでは、「サンプル数 n に対して、標準偏差の上限/下限がどれだけ離れるか」を見てみます。
※信頼区間とは「この範囲に本当の標準偏差が入っている可能性が高い」という“推定の幅”のことです。
95%信頼区間とは、100回標準偏差を計算した結果のうち95回はその範囲に収まるということです。
以下は、標準偏差の上限/下限の比(=推定誤差の大きさ)です。

ポイントはここです:
n=100 を超えると、標準偏差の推定誤差はほとんど改善しない
つまり、
n=100 前後が“合理的な上限” と言えます。
また、「n=30でいいのか?」という疑問への答えについては、
n=30は「ダメではないが、推定誤差が大きい」
n=100は「統計的に妥当で、実務的にも合理的」
というのが結論です。
Cpk の値は“見かけ上よく見える”ことがあり、サンプル数が少ない場合は特に注意が必要です。
Cp/Cpkの正しい使い方 では、Cpk の落とし穴について詳しく解説しています。
信頼性工学では63.2%信頼区間が使われることもあります。(例えばMTBF)
これを用いると推定誤差はやや小さく見積もられ、95%信頼区間よりも “現場感に近く” なります。
ただし、品質管理では一般的ではないため、参考情報として触れる程度として下さい。

・ Cpk は標準偏差の推定精度で決まる
・ 標準偏差の推定誤差はサンプル数に大きく依存する
・ n=100 前後で推定誤差は十分小さくなる
・ n=30 は使えるが誤差が大きい
・ n=5〜20 は推定誤差が大きすぎて危険
・ 測定コストと要求レベルのバランスで決めるべき
AIAG の旧マニュアルでは n=100 が推奨されていましたが、現在は明確な規定はありません。
しかし統計的には、n=100 前後が“合理的な落としどころ” と言えます。
Cpk が安定しない原因はサンプル数だけではなく、加工条件の変動によっても大きく左右されます。
加工条件の変動がCpkに与える影響 もあわせて読むと、工程能力の“技術的な側面”が理解しやすくなります。
※AIAGの旧マニュアル:全米自動車産業協会が発行したSPCマニュアル。
第1版では工程能力算出時のサンプル数が書かれていたが、第2版で削除された。