破析AQG 324 功率循环实验(PC)失效判定标准
道阻且长,其中必然包含过去的三年,而因疫情也耽搁了一些事情。2023年的2月份,几乎是我记忆中最忙碌的一个月,从南到北,从东到西,走遍了全国,线上线下做很多交流,话题中难免会提及行业关注度极高的问题——功率器件循环测试,Power Cycling。功率器件的功率密度很高,功率半导体器件如何满足“上车”,又如何在满足应用的条件下,尽可能降低产品的成本,最后的问题的焦点是功率器件的结温,而对于功率器件的结温及温度场的认识,整个产业还处于一个朦胧的状态。实际应用中,主要依赖的还是现有的车规级器件的可靠性标准。
车规级可靠性测试标准,被认可的功率半导体器件可靠性测试标准有两种,即AQG-324与AEC-Q101,可以认为,这两个标准分别代表着模块与单管两种器件的测试要求。其他由相关机构提出的可靠性测试标准都基本源于他们。
AEC-Q101标准设立之时,功率半导体器件还并未应用于新能源车的主驱部分。所以,作为功率循环测试判定指标,AQG 324是行业常常应用的可靠性验证标准。
AQG-324标准包含四大类的测试,分别是模块测试(QM)、特性测试(QC)、环境测试(QE)与寿命测试(QL)。在寿命测试(QL)中,分别考量器件在极限温度(高温/低温)、长时间耐压(HTRB/HTGB/H3TRB)与功率循环(Power Cycling)条件下的失效。其中,功率循环(PowerCycling)为AQG-324标准中操作难度最高的测试项目。一方面,限于个人认知,另一方面,功率循环(Power Cycling)实验要求和判定标准比较走心,本文仅对这方面做探讨和分析。
功率循环(Power Cycling)的原理:通过间隙导入加热电流使芯片在发热和降温之间反复循环,不断的造成器件内部温度不均匀分布,结合器件封装材料物理特性的差异(例如热膨胀系数CTE)造成器件内部的互联结构的逐渐老化,从而最终造成器件的失效。
图一 功率循环实验总体情况
AQG 324功率循环实验分为秒级循环(加热时间小于5秒)和分钟级循环(加热时间大于15秒),并定义了加热电流(IL> 0.85∙ICN),门极电压(15V)及环境温度(常数)。AQG324采用电学法测结温,遵循标准是 IEC 60749-34:2011,等同于JESD 51-1。实验过程中,通过采集器件热阻参数与正向导通电压来确定器件是否损坏。如果发现器件正向导通电压的突然升高情况,则表明器件内部的键合线发生了脱落或者断裂的情况。如果热阻参数升高,则表明器件在散热路径上出现损伤。器件的热阻参数是通过结温和相应测量的温差除以器件的功率来计算,对于壳温TC及热沉的温度TS 也规定的相应的测量方式,如下图:
图二 Tc 和Ts的测量
常见的器件的失效机理大概可以分为三种。第一是键合线脱落,第二是Die Attach老化,第三是焊接层疲劳,而实际情况大多数是这三种情况都会同时发生。秒级循环时,加热时间短,器件的压力主要作用于键合线和Die Attach,而分钟级别循环时,由于加热时间长,器件加热充分,焊接层的压力会显著增大。
图三 器件失效模式
秒级循环和分钟级循环的失效判定标准是一样的,既VDS(VCE,VF)增加值为5%,或者热阻值上升20%。前者的主要因素是键合线的脱离,后者的主要因素是总体散热路径的老化。
图四 失效判定标准
图中蓝色部分的中文翻译大致的意思:要保证一定的加热时间,获得足够的温升来计算热阻,而且因为TIM或基板是DUT的一部分,测量必须在不移动DUT的情况下在线测量。
这种测结温的方法存在先天的误差(参考文章:三维温度场视角比较热测试的动态法和静态法)。而Tc和Ts的测量点及测量方法也存在很大的局限性,我们很难定义某温度测量点温度的实际物理意义,从而结温和该温度测量的温度梯度的物理意义也不明确,计算出来的热阻是一个相对值。
这个相对值并不是实际物理意义的Rthjc,可能还会包含一部分接触热阻和其他的结构带来的热阻,当这个值增长20%时,器件本身的降级带来的增长究竟是多少?在实际实验过程中,希望精确测出Rthjx非常难以操作,再测试这个值的变化值,更是不可能。既然这两个值测量难度非常大,那么所谓的测试值增长20%,就显得有点蹊跷了——这个20%是怎么确定的?有什么具体的依据?是否有可以明确描述的物理意义?是不是可以调整一下,变成25%?
如果我们把测试热阻的方式由原有的IEC 60749-34:2011,变成JESD 51-14,我们记录每个固定循环周期完成时的结构函数,并把这些结构函数放到一个坐标系中做比对。结构函数是总体散热路径的一维表征,通过比对,我们可以清晰的了解散热路径的降级过程,而我们对比某一个特定热容值下的热阻值变化,这个变化值带来物理意义是明确的。
图五 结构函数在功率循环实验中不可或缺
在实际的实验过程中,想做出上图的效果,从实验设计角度来说,还是需要动一些脑筋的。首先,如果想使得测试的结构函数重复性好,在整个测试过程中,不能移动被测样品。其次,样品的降级过程并不是匀速的,那么循环多少次数测一次结构函数,这个参数也不能是一个固定值,理想的策略是要实时监控器件的VDS(VCE),当这个值变化不大的时候,可以适当放大测试周期,比如5000次循环测一次结构函数,而当这个值到一定程度,也就是濒临失效值的时候,就必须缩短测试周期,以获得精确的测试数据。第三,还要考虑其他因素比如接触热阻,系统热阻带来的影响,这就对实验设计提出了较高的要求,可以通过夹具的设计,实验参数的选择等尽量降低其他因素的影响,不同样品实验设计都会有一些差异,需要一定的测试经验。
这就需要功能循环和热阻测试要高度集成,通过反馈机制自动调节结构函数测试周期,从而得到能精确反映实际物理变化的实验数据。
图六 探索新的失效判定标准
有了大量的精确的测试数据,我们便可以尝试建立温度——应力——疲劳等物理模型之间的关联,从材料的底层去探索失效机理,尝试建立应用性较高的寿命模型。结合实践的检验数据,我们可以了解失效的判定标准20%是否合理?有没有可能放宽这个值,放宽到多少合适?
要知道,如果能找到这个值,哪怕放宽一点点,对整个行业的资源节省,是相当惊人的,所以这也是我们整个行业值得去探索及研究的课题。
当前有不少车企亲自下场入局功率半导体器件市场,相关测试标准的细化与统一也将进行的更快,而数字孪生技术给我们提供了检测温度场变化及温度场瞬态变化的可能性,温度场是三维的,我们用一个特定值作为判定标准,始终有一定的局限性。
图七 数字孪生技术在功率循环实验中的应用
基础研究我们可以运用数字孪生技术,实际运用我们用数字孪生技术其可操作性就降低了,或许基于详细模型抽取出来的降阶模型,因其计算速度快,同时也能保证一定的精度,满足实际的应用要求。随着该模型的不断应用,或许逐步演变成未来的标准。