Cp, Cpk, Pp 和 Ppk这几个概念在工业制造领域的应用已经很普遍了,但是这些概念往往被混淆。国内国外,网上网下,各持己见,说法不一,给质量行业的晚辈们一种不明觉厉的感觉。其实,Cp, Cpk, Pp 和 Ppk都是用来体现过程能力的指标①②,它们是用来测量过程能力的指数(process capability index),不是过程能力本身。很多人只知道计算这些指数,却并不知道过程的固有能力到底是什么。 那什么是过程能力(process capability)?
过程能力是指过程本身在没有外因干预、没有漂移(drift)(即统计学意义上可控under statistical control)的情况下其产出品的均一程度 (uniformity of product)②③。 不难理解,我们不可能直接测量过程本身,而只能通过测量其产出品的某个特性来体现其能力③。通常用被测量的特性的离散程度, 即标准方差, (西格玛),来表示过程能力。而且过程能力被量化为 ,即其总宽度为6个西格玛。其中 是过程的均值(mean), 是过程的标准方差(西格玛)。
例如A过程的西格玛=2,其过程能力=6*2=12。
B过程的西格玛=2.5,其过程能力=6*2.5=15。 那么问题来啦:A过程和B过程那个好呢?
答案是:视情况而定(it depends)。为什么? 因为没有判断标准。
也许你已经注意到过程能力的定义与产品的可接受标准(specifications)无关。可是抛开产品的可接受标准,单纯地讲过程能力,又毫无意义。这就是为什么人们要引入“过程能力的指标(Cp, Cpk, Pp 和 Ppk )”这些概念。
Cp, Cpk, Pp 和 Ppk这些指数是过程能力和可接受标准比较的结果,也被称为过程能力比率(process capability ratio)③。笔者更倾向于使用过程能力比率,因为它直观。另外这些概念的计算都引入了标准方差或西格玛,因此它们都是统计学意义上的概念,也正是如此它们都没有单位。
有趣的是,权威书籍中均没有体现这几个符号(Cp, Cpk, Pp ,Ppk)所代表的英文词。 而在这个英文网站上⑥:https://www.isixsigma.com/tools-templates/capability-indices-process-capability/ 有以下的定义:
这些定义很显然是有问题的,因为这四个符号都是“index”或“ratio”。 笔者认为它们的定义是这样的:
Cp= Process Capability Ratio 可被译为“过程能力指数”
Cpk= Process Capability K Ratio 可被译为“过程能力K指数”
Pp= Process Performance Ratio 可被译为“过程绩效指数”
Ppk= Process Performance K Ratio 可被译为“过程绩效K指数”
注:据有人说 这里的‘k’ 是 ‘centralizing facteur’⑥,可能是法语,即“居中因子”。
据此,Cp和Cpk被称为过程能力指数;而Pp和Ppk则被称为过程绩效指数。我们权且将过程能力指数和绩效指数统称为衡量过程能力的指标。
以上是关于Cp, Cpk, Pp 和 Ppk这些指标的定义。下面我们讨论这些指标的计算方法。
了解了这些概念和计算公式,下面让我们看看这些指数的共同点和区别。
4.1 Cp, Cpk, Pp 和 Ppk的共同点
Cp, Cpk, Pp 和 Ppk都是用来测量过程能力的指标。它们的共同点是:
• 都被用来表示过程能够生产出达到可接受标准的产品的程度或能力
• 都被用来表示过程的产出品的离散程度和可接受标准的比率
• 它们的值越大,过程越能够更好地生产出达到可接受标准的产品
当然它们也各有区别。
4.2. 有k指数(Cpk和Ppk)和没k指数(Cp和Pp)的区别
首先是有k指数(Cpk和Ppk)和没k指数(Cp和Pp)的区别:没k指数(Cp和Pp)只显示过程的产出品的离散程度和可接受标准的关系;而有k指数(Cpk和Ppk)除了显示过程的产出品的离散程度和可接受标准的关系外,还关注过程的产出品的均值是否偏离可接受标准的中间值。其数学关系是:有k指数永远不大于没k指数,即:
• Cpk≤Cp(当过程的产出品的均值和可接受标准的中间值重叠时,Cpk=Cp, 否则Cpk<Cp);
• Ppk≤Pp(当过程的产出品的均值和可接受标准的中间值重叠时,Ppk=Pp, 否则Ppk<Pp)。
我在工作中发现没K指数(Cp和Pp)应用得较少,估计是因为很少有过程的产出品的均值正好与可接受标准的中间值重叠。 但其实这是不对的:有k指数(Cpk和Ppk)和没k指数(Cp和Pp)应该一起使用才能准确体现过程的能力①,详情其后讨论。 现在让我们先看看过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)的区别。
4.3 过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)的区别
过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)的区别,即Cp和Pp的区别,Cpk和Ppk的区别。
其中 R-bar是通过将被考量的过程在某一时段(考察区间)的产出品的观察样本的某个性能的数值制成过程控制图(Control Chart)来得到的;而d2 则是一个统计学常数,与过程控制图的样本亚组(subgroup)的样品个数有关,其值可以参考下表⑤。
d2的值可以通过很多书籍查到①②③④,但常用的就是n小于10的值。其实超过5的话数据量就很大了。
现在我们了解了S和 西格玛的区别,那么我们是不是就理解了Cpk和Ppk的区别了呢?似乎没那么简单。 相信大家还是弄不清它们的本质区别。下面我们用一个很容易理解的例子来说明一下它们的计算。
假设公司有班车接员工上班, 我们让坐班车的同事记录班车第一个站到公司的时间(分钟),观测了30天,得到下面表格的数据。
使用标准差公式计算,得出S=11.6。
假设公司要求司机每天要在从第一站到公司的时间要保持在55分钟到70分钟之间(时间太短司机可能超速,不安全,时间太长班车会晚点),则LSL=55,USL=70。 套用以上的公式可以得到以下Pp和Ppk的结果。
根据这个控制图,得到 R-bar=12.7。运用上面的公式 可以得到 西格玛=12.7/1.128=11.259。再运用Cp和Cpk的公式得到:
Cp = 0.222, Cpk = 0.138
综上我们可以得到以下的结果:
Pp = 0.216 Ppk = 0.134;Cp = 0.222, Cpk = 0.138
大多数人可能都会得到这样的结果并就此打住。 但是这里关于Cp和Cpk的计算存在很明显的错误,因为Cp和Cpk的计算是有两个必要条件的③:
1. 过程是稳定的(处于统计受控状态)
2. 所观测的数据是呈正态分布的
没有这两个必要条件所计算出来的Cp和Cpk值是不具有统计学意义的①③,或者说所得到的Cp和Cpk不准确。
上图很明显地看出,这个过程是处在“非稳定或非可控”(not stable or not under control)状态,因为图中有1个点超出了控制上限(UCL)。根据Cp和Cpk的定义,该组数据中有特别原因造成的点,过程不稳定,因此不能直接用此控制图的数据来计算Cp和Cpk。 这也是为什么不要用数学公式来直接计算 并计算Cp和Cpk的原因。 为了得到稳定的过程控制图,需要把这个点去掉,再重新制图,得到下面的控制图。
于是我们得到结果:
Cp = 0.330
Cpk = 0.193
可以看出实际的Cp和Cpk都有所增加。 也就是说如果过程不稳定,计算出来的Cp和Cpk值会偏低,这就会低估过程的潜在能力。
根据定义,Pp和Ppk 的计算是不可以把这两个点去掉的。因此Pp和Ppk 是不需要重新计算的。 这样针对这个例子中的数据,我们可以得到:
Pp = 0.216, Cp = 0.330;
Ppk = 0.134, Cpk = 0.193;
除了过程稳定,过程能力指数(Cp和Cpk)的计算还需要数据呈正态分布。那么这组数据是否符合正态分布呢?我们可以借助统计学工具来做分析,如下图。 可以看出p>0.05,所以这组数据是成正态分布的。所以上面的计算是成立的。
值得注意的是数据是否成正态分布与过程是否稳定没有直接的关系。不稳定的过程的数据也可能是成正态分布的。
至此,该组数据(去掉两个点)通过了这两个测试: 过程稳定和正态分布。因此上面的关于Cp和Cpk的计算是正确的。而用于Pp和Ppk计算的数据则不必进行这两个测试。
通过这个例子,可以将过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)的区别总结如下:
1. 过程能力指数(Cp和Cpk)表示的是过程在稳定(即没有任何特殊原因或漂移干扰产出品的特性或者说是在可控(under control)的)状态下能使其产出品达到可接受标准 的程度的指标,也可以理解为过程的"潜在"能力③。(注:"潜在"是相对目前的过程条件而言,改变过程条件可以不断提高Cp和Cpk,这就是不断改进(continuous improvement )的理念。因此将Cp和Cpk翻译成"过程潜能指数"和"过程潜能K指数"更为贴切。因为Cp和Cpk体现的是稳定状态下过程的潜在能力,因此Cp和Cpk可以用来预测该过程将来在现有过程条件下的最好的情况。
2. 过程绩效指数(Pp和Ppk)则是过程在过去某个观察时段内的实际绩效,即是该过程的已经产生的产出品实际达到可接受标准的情况。它们不考虑过程是否稳定③,即便可能包括特殊原因(special cause)干扰产出品的特性或者说过程不一定处在一个可控的状态(out of control),同样可以计算出Pp和Ppk。由于Pp和Ppk是体现过程在过去的某个时段的绩效,所以Pp和Ppk被称为"过程绩效指数"。也正因如此,Pp和Ppk 仅代表过程过去的情况,并不能用来预测过程将来的状态③(将来可能更好也可能更坏,当然也可能一样)。许多作者反对使用过程绩效指数,因为它们没有统计学意义,而且认为是统计学在SPC--统计学过程控制中应用的倒退③。有趣的是过程绩效指数(Pp和Ppk)是美国三大汽车公司为了对其供应商的绩效进行标准化而产生的,并且被纳入了美国ANSI标准③。
笔者认为过程绩效指数(Pp和Ppk)的产生与其计算简单且没有太多的统计学限制有关。因为它们始终不会大于过程能力指数(Cp和Cpk),作为过程过去的业绩指标还是可以的。 但是它们会低估过程的实际潜在能力,可能误导过程改进的方向。
3. 许多作者都认为过程能力指数(Cp和Cpk)是短期过程能力指标,而过程绩效指数(Pp和Ppk)是长期过程能力指标①②③⑥。但这个说法很容易被误解为Cp和Cpk是短时间收集的数据,而Pp和Ppk是长时间观测收集的数据。而实际上这里的"短期""长期"与采集数据的时间长短没有任何关系①,因为短期测试结果也可能存在由特殊原因引起的离散(variability),而长期收集的数据也可能没有特别原因引起的离散。其本质的区别是计算中是否允许有被特殊原因引起离散的数据:Pp和Ppk是将所有被观测的样本数据都用于标准方差的计算, 而用于计算Cp和Cpk的西格玛不应该包括由特殊原因引起离散的数据。
综上,我们可以将过程能力指数(Cp和Cpk)及过程绩效指数(Pp和Ppk)的本质区别总结如下:过程绩效指数(Pp和Ppk)是过程的过去或现实;而过程能力指数(Cp和Cpk)是过程的潜能或将来。过程能力指数的计算必须满足"过程稳定"和"数据正态分布"两个必要条件;而用于Pp和Ppk计算的数据则不必进行这两个测试。过程能力指数及过程绩效指数的数学关系是:Cp≥Pp , Cpk≥Ppk。当过程稳定(stable或under control)且数据呈正态分布时Cp=Pp,Cpk=Ppk(注意这里的"="是统计学意义上的相同);只要有特殊原因存在, Cp>Pp , Cpk>Ppk。 理解这一点对它们的应用很关键。
5. Cp,Pp ,Cpk和Ppk的应用
首先了解过程能力指数和过程绩效指数的区别可以帮助理解在什么情况下采用哪个指标。通常要知道过程的实际绩效情况,即过程实际的产出品满足可接受标准的情况,应该采用过程绩效指数。 如果想知道目前的过程是否已经是达到了稳定的潜在状态时,可以比较过程能力指数和过程绩效指数的差别,即Cp和Pp, Cpk和Ppk的差别:二者差别越小,说明目前的过程的绩效越接近稳定状态,即过程不存在太多的特殊原因引起的偏离(variation)。 如果差异很大,则说明过程不稳定,需要找出那些特别的原因,消除这些原因,过程即可被改进。管理者也可以利用过程能力指数和过程绩效指数的差别,制订不断改进的目标。例如上面的例子Ppk=0.134, Cpk=0.193。目标可以是让Ppk达到0.193.
了解了有K和没K的区别可以帮助公司判断过程的产出品是否偏离可接受标准的中间值。如果Pp和Ppk比较,Cp和Cpk比较,相差不大,说明过程的产出品的特性均值没有偏离可接受标准的中间值太多。要提高Ppk或Cpk的值,只能减少点间差或样品亚组内最大和最小值的差异,即降低过程的标准方差(S或 西格玛)。如果Pp和Ppk比较,Cp和Cpk比较,相差很大,那么将过程的产出品的特性的均值调整到可接受标准的中间值,就会很有效地提高Ppk和Cpk值,使过程能更好地满足可接受标准的要求。当然这也可以通过计算样本的均值,并和可接受标准的中间值比较来完成。
在制药业中过程能力指数和过程绩效指数的另一个方面的应用是持续过程确认(CPV)。当选定的关键过程参数CPP (Critical Process Parameter)或关键质量属性CQA(Critical Quality Attribute)的数据经过计算得到过程能力指数和过程绩效指数时,很容易看出过程是否“能达标”,也可以看出过程是否稳定。如果过程稳定,而且能达标,则可以结论目前的过程是处在可控的状态下,即已验证的状态得以保持,再验证就是不需要的。
另外,过程能力指数和过程绩效指数可以被用来衡量供应商的业绩。如果可接受标准是一样的,当然指数越大的供应商越好。
值得注意的是经典的作者都没有将过程绩效指数(Pp和Ppk)作为考量过程是否能达标的指标①③,因为绩效指数的计算没有考虑过程是否稳定,而没有稳定性就没有过程能力可言①。
6. 关于使用计算机统计软件的讨论
目前市面上有许多计算机软件可以计算过程能力指数和过程绩效指数。 使用这些软件时必须要理解软件背后的设置,并且要了解数据是如何采集的,以及所采集的数据和所关注的过程的关系。只有这样才能更好地解释得到的结果。 运用同样的例子,我们可以用Minitab来计算过程能力指数。
首先我们把30天的数据都输入Minitab,选择"Process Capability Sixpack Report", 得到下图。
依图可以得到以下结论:
• 数据是呈正态分布的(p>0.05)
过程是不稳定的(有一个点超出UCL)。尽管数据中有超出UCL的点,Minitab还是给出了计算结果:
Pp = 0.22 Cp = 0.22
Ppk = 0.13 Cpk = 0.14
这个结果和4.3节中第一次计算的结果完全一样(有效数字不同)。
而我们知道这个结果是不准确的,因为过程能力指数是用不稳定过程的数据计算出来的。准确的结果应该是4.3节中第二次计算出来的结果:
Pp = 0.216 Cp = 0.330
Ppk = 0.134 Cpk = 0.193
也就是说Minitab这个设计从科学的角度讲是不严谨的。
当然如果我们将除去那两个点以后的28个数据点输入Minitab做同样的计算,我们得到下图。
这时只有稳定的过程的数据,过程能力指数(Cp和Cpk)的计算才是正确的。很不幸的是这里Minitab也重新计算了绩效指数(Pp和Ppk)。但原则上,这里却是不需要重新计算绩效指数(Pp和Ppk)的。 同样可以说Minitab这个设计从科学的角度讲是不严谨的。
值得指出的是控制图的制作和过程能力指数的计算都是简单的数学计算,没有昂贵的计算机软件同样可以做到。 以上两个Minitab图中的计算和前面4.3节中笔者用Excel计算和做出来的图是一样的。
7. 总结
过程能力是指过程离散度的6西格玛宽度,与其产出品的可接受标准无关。如果过程的产出品的数据是呈正态分布的,那么99.73%的数据会落在这个6西格玛的宽度内。
常用的衡量过程能力的指标有过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)。没k指数(Cp和Pp)只显示过程的产出品的离散程度和可接受标准的关系;而有k指数(Cpk和Ppk)除了显示过程的产出品的离散程度和可接受标准的关系外,还关注过程的产出品的均值是否偏离可接受标准的中间值,其数学关系是:Cpk≤Cp;Ppk≤Pp。
过程能力指数(Cp和Cpk)和过程绩效指数(Pp和Ppk)的主要区别是:
过程能力指数(Cp和Cpk)是具有统计学意义的指数,表示的是过程的“潜能”,可以用来预测过程的将来,而过程绩效指数(Pp和Ppk)的统计学意义并不被专家们接受,并且不能被用来有效地预测过程的未来。
8. 后记
过程能力指数是上个世纪后期才产生出来的概念。最早Cp是由Juran于1974年提出来的,而Cpk是Kane于1986年才提出来的⑦。而且用于衡量过程能力的指数仍在不断发展中,新的指标也不断地被提出。本文仅仅探讨了4个最常用的指标。另一个较常用的指标是Cpm。由于篇幅和其应用的限制,这里不做介绍,有兴趣的读者可以阅读参考文献⑦。
过程能力指数(Cp和Cpk)可以被用来估计有多少产出品会落在可接受标准的外面(即不合格品)。当Cp= Cpk =1时,而且数据是呈正态分布的话,99.73%的数据都会落在可接受标准的区间内。 具体的计算需要更深的统计学知识。这里也不做介绍,有兴趣的读者可以参考文献③。
另一个重要的理念是以上关于过程能力指数(Cp和Cpk)的计算是“估计”值,因为过程的西格玛和均值都是通过样本的值来估计的。因此过程能力指数Cp和Cpk的准确性是可以通过统计学计算来建立“置信空间”(confidence interval)的。 同样基于篇幅的原因,这里不做详细介绍,有兴趣的读者也可以参考文献③。
9. 参考文献
①Manuel E. Peña-Rodríguez:Statistical Process Control for the FDA-Regulated Industry, ASQ2013
②Joseph M. Juran: Juran’s Quality Handbook, 5th Edition, McGraw-Hill, 1998
③Douglas C. Montgomery:Statistical Quality Control,Wiley,2012
④Roger Hoerl & Ronald D. Snee: Statistical Thinking, Duxbury, 2002
⑤Brain K. Nunnally & John McConnell: Six Sigma In The Pharmaceutical Industry, IRC Press 2007
⑥https://www.isixsigma.com/tools-templates/capability-indices-process-capability/
⑦Samuel Kotz & Norman L. Johnson:Process Capability Indices-A Review, 1992-2000, Journal of Quality Technology, Vol. 34, No.1, 2002