首页/文章/ 详情

结构函数和器件的可靠性

4月前浏览2428

结构函数和器件的可靠性  

——写在用户年会之后  

摘要:结构函数理论性强,精度高,应用结构函数可以观测电子器件的失效过程,精确量化失效参数,因而在电子器件热可靠性评价中,有广泛的应用前景。  

01 现状及问题的提出  

汽车功率器件的可靠性标准AQG 324是推荐标准。AQG 324标准的火热起因于某主机厂的需求。在疫情器件,由于缺少大量的芯片,不得不放开采购来源,为了对芯片的质量做筛选,要求供应商的产品必须满足AQG 324的标准。  
个人的观点,该标准的功率循环实验存在着一些不可避免的问题(参考文章:《破析 AQG 324 功率循环实验(PC)失效判定标准》)。  
第一.热阻测试问题。AQG 324标准中,失效判据是正向电压增加5%(主要由Bond wire脱落导致),或者是热阻增加20%,而热阻测试延用的是JESD 51-1的标准,数据重复性不好;  
第二,实验设计问题。AQG 324的实验设计分为秒级循环和分钟级循环,电流要求大于满载电流的85%,秒级和分钟级分别对应不同的封装材料,但比较模糊,而85%的电流和实际工况有一定的差距;  
第三,数据处理及应用问题。在一定的循环次数下是否失效,是目前主要的工程应用,而失效分析略显不足,不利于器件的持续改进。  

02 问题分析  

JESD 51-1标准对热阻的测试,存在很大的误差,有一些极端的状况还会出现循环后的热阻值小于循环前(具体原因在前面的文章中多次论述,这里就不再重复),这是数据重复性不好的主要原因,而SIC的数据重复性尤其不好。也有一些企业意识到了这个问题,把热阻测试标准从JESD 51-1 换成了JESD 51-14,工程应用中,通常是功率循环试验前测一次热阻,功率循环实验后再测一次热阻,计算这两个值之间的差值,如果小于20%,说明器件合格。  
JESD 51-14标准明确指出,离开了测试条件,最终的测量值是没有意义的。而功率循环前后的测试条件显然发生了变化,即使用双界面法去测热阻,其数据的物理意义一样会发生变化,最终导致热阻的漂移值并不能成为失效的有效判据。  
关于实验设计,我以前也曾写过两篇文章(参考文章:《功率循环的实验设计》),文章认为AQG 324的实验设计,并不是考察汽车电子可靠性的等效加速模型,更近乎是一张门票——如果能过即可上车。可靠性的影响因素很多,简单的秒级和分钟级循环无法对这些影响因子做出精准的量化数据。这个领域,应该说是才刚刚打开一扇门,后期要依赖有效的数据分析方法和工具,设计更精细的实验,获得有一定参加价值的数据,建立重复性高的可靠性模型,去探索相关的失效机理。这需要整个行业对这件事情有清晰的认知,并投入资源做大量深入的研究,从而建立更有效的行业标准。  
在测量精度不能保证,实验设计存在缺陷的前提下,数据其实就没有什么参考价值。或者我们可以认为,在企业内部,获得这种数据就相当于一个工作任务,做过了,有相应工作记录即可,而在第三方测试中心,更多的是提供一个报告,甚至可能在数据不过的情况下,通过调整实验参数,获得想要的数据,以达到测试通过的目的。  

03 结构函数是解决方案  

结构函数是一种理论方法,起源于20世纪初,是由法国数学家ClaudeShannon首次提出。结构函数通过数学模型来描述结构系统的性能和参数之间的关系,可以分析复杂结构系统性能,因而被广泛应用于各类工程设计及科学研究中。  
散热系统的结构函数,通过对结温的瞬态变化采集,转换成的热性能参数(热容,热阻),并尝试对结构函数和散热材料之间的关系经行建模,从而实现对系统散热结构的观测和优化。这方面的应用贡献主要来源于匈牙利的科学家Szbkely上一个世纪80-90年代间,Szbkely在该领域做了大量的研究(参考文章:《半导体瞬态热测试技术的前世今生及未来》),并在2010年形成JESD 51-14的瞬态热测试标准。  
结构函数是散热路径的一维数学模型,而温度场是高斯分布,实际的散热路径上的材料总和,和边界条件有很大的关系,因此结构函数和材料之间的对应关系是模糊的,并不严谨。直到2016年,罗亚非博士的《三维热阻模型》,可以对结构函数和散热路径上的材料做精确建模,从而推动了整个行业技术的发展。  
器件在实际使用或者老化实验中,由于交变应力的影响,器件的材料之间会产生一定的间隙,缺陷,这些缺陷和间隙会导致器件的整体散热能力退化,这就是用热阻的增加值作为器件降级判据的原因。但是器件的散热路径上有很多层不同的材料,每一层之间都存在接触热阻,这导致整个器件的散热结构非常复杂,热阻值是一种综合效应,无法定位到用结构函数来对这种复杂结构进行建模,可以观测电子器件的失效过程,精确量化失效参数,因而在电子器件热可靠性评价中,有广泛的应用前景。  
最早功率循环设备结合结构函数应用的是中车,当时中车一直用基于热阻法的功率循环设备,同时中也采购了Mentor的瞬态热测试设备。基于热阻法的功率循环设备测热阻误差较大,便产生了把瞬态热测试设备和老化设备集成在一起的想法。罗亚非博士当年在Mentor任亚太区技术总监,在客户的需求驱动下,主持研发了集成功率循环和瞬态热测试两大功能的设备——PWT。同时基于PWT的功能特性,开发了一系列数据获得,数据分析和数据处理的工程应用规范,只是因为相对比较严格,并没有在行业内部得到有效的推广,然而像中车,芯联等头部企业,他们在处理功率循环的数据时,其判据基本上采用了结构函数的漂移值,而不是电压的漂移值,这样可以保证数据的重复性和精度。  

04 结构函数应用的注意事项  

结构函数比较敏感,想要得到准确的结构函数曲线,在瞬态热测试的实验设计中,我们必须要严格执行瞬态热测试的工程应用规范。  
首先要对样品进行预检,以确定合理的检测参数,包括加热电流,测试电流,测试环境参数等等。选择合适的测试电流,就需要标定其电压温度响应曲线——K系数,并要对测K的过程数据做全面记录以保证数据可追溯。  
其次,测试结构函数要保证数据的重复性,任何实验都有一定偶然性,保证实验数据的精确,其重复性验证是一个必要环节。验证重复性的方法也有很多,常用的就是数据的乖离率,另外加热区的电压上升曲线的重合度也可以保证数据的重复性。在验证重复性的过程中,要注意测试条件的变化,周围的环境对数据的影响等等。  
第三.为了得到理想的结构函数漂移曲线,在功率循环实验的整个过程中,绝对不能移动或者重新装夹样品。为了能观测器件的降级过程,通常可以设计一定的功率循环周期后,暂停功率循环,测一次结构函数,然后继续老化。不移动样品或者不重新装夹,是为了保证样品以外的热阻变化尽可以很小,消除不必要的实验误差。如果每5000次测一次热阻,那么在10万次功率循环实验中,我们可以得到20条结构函数曲线,可以形成一个逐步右移的结构函数图谱,然后通过等热容线去观测结构函数的漂移。  
样品的降级还可以通过局域结构函数和二次微分结构函数去观测,局域结构函数横轴是热容,纵轴的热容对应的热阻值,器件降级一般不会只发生在同一层材料上,通过局域结构函数,可以观测每个热容对应的热阻变化,从而找到器件降级过程中相对比较薄弱的环节。二次微分是微分结构函数对热阻的再一次求导,这个需求也是来源于客户,他希望从二次微分结构函数上,看到各层材料之间的温度场梯度的突变,具体如何应用,我们也在摸索阶段。  

 

图一 局域结构函数和二次微分结构函数  

05 结论  

可以认为,功率器件的可靠性主要是因为热问题导致的,而器件散热路径的客观数据,包含各层材料对应的热容值和热阻值及其变化,可以准确描述器件的散热性能及降级过程。通过结构函数和材料之间的对应关系,还可以定位器件主要降级发生的位置信息。器件老化过程中,Bond wire 脱落,Die Attach的降级,焊接层的降级等等,最终都会导致电压上升,通过结构函数的漂移,对散热路径做精确的检测和分析,能提取出每层材料退化所占有的权重,为器件的封装方案的优化,提供了坚实的数据基础。  
基于JESD 51-1的设备,在同等的条件下,其实验数据和基于JESD51-14的比较接近,但两种设备成本和价格存在很大的差异。其中最主要的原因是看客户的应用是基于放行逻辑,还是精确判断逻辑。如果基于放行逻辑,主要衡量点就是过不过,只要条件确定,最终数据横向比较,还是有意义的,在该应用点上,客户没有必要采购昂贵的设备。  
而如果客户应用是基于精确判断逻辑,希望能准确知道器件的设计和可靠性的关系,并通过实验数据,找到研发的问题,持续改进。在这个应用点上,结构函数是不可或缺的。  

06 展望  

有很多人都有这样的观点,认为带结构函数的设备,其应用有一点超前,更适合实验室做精细的研究,平时的可靠性检测,用不带结构函数的设备即可。  
个人对这个观点,并不完全认同,持有上述观点的人,其主要的原因有两个:如果严格的执行同样的实验条件(不能调整参数),实验结果横向对比,确实是有一定的参考意义,更重要的是,国外的大厂,比如英飞凌,意法半导体,赛米控等半导体行业巨头,他们对可靠性的评价,也是依据AQG 324实验。  
确实如此,但在产品设计上,国际半导体巨头和中国的企业有一个本质的差别。国际巨头的产品是正向设计,在设计的过程中,依据企业在材料,仿真,电子电路的积累,在正向设计的大背景前提下,用一个标准作为对设计的检验,可以认为是加了一道防火墙,一可以规避一些设计可能存在的潜在风险,二可以防范一些工艺波动,这样基本上就可以保证产品的可靠性。我不能说这种方案是最合理的,但确实可以解决问题。但国内的半导体企业,走正向设计的少之又少,很多可能导致可靠性问题的因素,并没有在早起的设计中排除掉,而被带入到产品的设计方案中,用AQG 324这种非常粗略的检验手段,并不能有效的检测出设计中的问题,甚至一些被放行的设计方案,都有可能存在设计风险。  
我并非在危言耸听,可靠性的问题,通常是在产品应用中被发现(实际上已经有一些案例了),这需要一定的时间,现在没有发现,并不代表这些问题不存在。从理论上,我们必须建立底层的可靠性逻辑,通过对半导体材料的性能监控,充分分析影响可靠性的因子,结合合理的实验设计,得到有效的数据和加速模型。  
结构函数不仅可以满足功率循环实验的要求,在器件其他的可靠性实验中,也可以发挥巨大的作用。可靠性可以分为微笑曲线的左侧可靠性和右侧可靠性。比如我们常见的间隙老化和温度循环,还有施加特定负载的拖动台,都是属于右侧老化实验,其原理就是给器件按照其实际工程应用要求,加载一定的加速负荷,再观测其器件的降级过程,而如果用结合结构函数技术,可以观测器件的实际降级过程。而无功老化,器件遴选,质量检测等工程应用,大部分是微笑曲线的左侧,当器件被施加一定的载荷后,通过结构函数的判断,可以更准确的评价器件性能。  

 

图二 结构函数的拓展应用  

中国企业的崛起,离不开逆向设计,我们学习国外先进的技术,迅速积累工程应用的知识,但不能简单的照搬照抄。产品研发体系是一个整体的有机系统,每个环节并不是独立的,我们要依据现有的技术框架,找到底层逻辑,当国外的底层逻辑并不是很清晰的时候,就要立足基础研究,形成产品设计的闭环。基于这个逻辑,我个人觉得,不仅仅我们要学会应用结构函数,还需要大面积的应用,做更有深度的应用,倘能如此,中国企业在技术上赶上甚至超越国外的企业,只是一个时间问题。  

来源:今昔CAE随笔
电路半导体汽车电子芯片焊接理论材料试验
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-08-04
最近编辑:4月前
今昔CAE随笔
本科 | 销售总监 allenchousf
获赞 93粉丝 157文章 61课程 1
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈