随着国内企业的快速发展和竞争日趋激烈,越来越多的制造企业和研究院所,利用CAE仿真技术推动产品研发与制造。基于CAE的仿真技术和应用已成为保障产品质量、缩短研发周期的有力手段。
随着CAE仿真技术的快速发展和应用,仿真数据越来越多、仿真流程越来越复杂。一些企业的仿真数据每年以十几TB甚至几十TB的速度增长。在持续的工作中,积累了大量的仿真数据和知识。如何对仿真数据和流程进行有效管理、如何利用机器学习和大语言模型技术智能化地支持仿真业务工作,成为仿真业务一个重要的方向。
尽管企业普遍采用了CAE技术为产品研发赋能,但是仿真工作的专业化门槛较高、仿真工具种类繁多、仿真求解时间长、生成的数据量很大。如何利用大语言模型和机器学习技术进一步支持仿真业务,从而推动数据重用和效率提升?
基于越来越激烈的市场竞争,企业希望缩短产品研发周期、进一步提高仿真验证能力、提高产品研发质量和降低成本。例如有的汽车企业努力将新车研发周期从原来三年缩短到一年半,仿真业务是其中重要一环。
仿真工作涉及大量的数据,包括结构化数据、以及大量的文档类非结构化数据。如何建立高效的重用机制和手段对于提升仿真研发至关重要。
仿真关键结果、输入参数等数据可以结构化存储在仿真平台中,并可高效查询检索和进行数据之间关联追溯。而机器学习能利用这些数据进行训练,进而可以进行快速性能预测和优化。大语言模型则可对仿真知识文档等非结构化知识进行提炼和重用。
利用机器学习可实现模型降阶,对复杂的仿真计算进行简化和加速。利用机器学习和大语言模型技术,在项目初期就能进行大量方案验证和优化,减少后期设计变更带来的风险。
在仿真业务研发中,仿真工程师往往需要高频查阅相关领域的知识、规范、标准,以及项目大纲、仿真指标等内容。如何利用大语言模型技术通过交互问答帮助仿真工程师快速找到相关内容,并协助仿真工程师撰写项目总结、仿真报告等。从而减少工程师负荷并提高效率,成为其得力的助手?
智能化大语言模型具有广阔的知识视野,结合本企业仿真知识构建本地化知识库,能够为企业产品仿真研发带来新的技术变革,从而引领未来技术融合和进一步创新。
海克斯康融合DeepSeek大语言模型和机器学习的SimManager智能仿真平台方案集成架构如下:
图1 融合大语言模型和机器学习的SimManager智能仿真平台
该集成架构由以下三部分组成:
通过SimManager构建企业级涵盖各个学科仿真业务的统一的仿真数据和流程管理平台。平台可基于客户需求进行配置和开发,包括如下模块:
仿真数据管理:各学科仿真数据的数据库构建、数据导航、数据版本管理和数据谱系、数据查询、对比等;
仿真任务管理:定制化的分析任务模板,可批量分配分析任务以及分析任务线上审批;
仿真流程管理:构建前处理、求解、后处理、仿真报告生成的仿真流程,集成工具软件和HPC系统;
仿真知识库: 建立仿真规范、标准、模型、材料库等的知识库;
权限和系统管理:分角色的权限管理和系统配置管理;
外部系统集成接口:支持外部PLM、TDM、HPC等第三方系统集成。
在智能仿真平台方案中,SimManager定位为仿真工程师工作环境、以及提供机器学习和大语言模型的数据源:
进行仿真数据和流程管理,提供仿真人员日常工作环境(如接受仿真任务、启动仿真工具进行前后处理和求解、仿真报告、任务审核、方案迭代、数据查询对比和追溯等);
基于仿真评价目标值,对方案结果进行达标展示,协助仿真工程师方案迭代;
仿真平台数据库提供机器学习建立降维模型的样本数据;
仿真平台数据库提供大语言模型企业所属专业的仿真知识(项目文档、仿真报告、标准、规范等)。
机器学习Odyssee软件能利用样本数据输入进行新方案快速预测和方案优化。在智能仿真平台方案中,SimManager提供样本输入和流程管理,Odyssee提供机器学习功能,包括:
生成DOE样本数据点;
降维模型生成和新方案快速预测(秒级);
方案快速优化;
敏感输入参数识别等。
图 2 SimManager集成Odyssee进行机器学习
在智能仿真平台方案中,DeepSeek大语言模型框架提供如下能力:
基于仿真平台数据库建立企业本地仿真知识向量数据库,即时响应用户问题;
基于仿真平台数据库历史产品的方案优化迭代数据和经验,为仿真工程师提供在研产品的方案改进建议;
协助生成仿真用户需要的相关文档,如项目总结、仿真报告等。
融合大语言模型和机器学习的智能仿真平台应用场景,除了常规的基于仿真平台的仿真工作以外,基于大语言模型LLM+机器学习ML的赋能,扩展应用场景如下:
图 3 融合大语言模型的智能仿真平台扩展应用场景
基于上述架构的进行了SimManager+DeepSeek+Odyssee的本地化集成部署。采用DeepSeek开源的大语言模型,并在本地部署文字向量化数据库,将本地(用户生产环境则对应SDM数据库)的仿真知识,进行向量化存入本地向量数据库,作为在仿真专业领域进行更精确回答的基础。
因原始的大语言模型未涵盖本地知识,在构建本地向量数据库前,针对相关问题不能给出准确的回答。在将相关数据和文档上传SimManager平台,同时进行向量化。当用户提问时,系统自动将带有提示词的上下文信息提供给大语言模型,能够给出准确的回答。如下图:
图 4 基于DeepSeek本地知识库的仿真平台问答场景(1)
图 5 基于DeepSeek本地知识库的仿真平台问答场景(2)
通过应用实践,融合大语言模型和机器学习的SimManager智能仿真平台,能够进一步扩展仿真平台的使用场景,协助仿真人员实现仿真知识快速反馈、仿真数据挖掘和重用、协助文档生成、专家经验重用等,如下所示:
图5 融合大语言模型和机器学习的SimManager智能仿真平台