首页/文章/ 详情

【成功案例】云端芯片设计:Mellanox 通过按需混合云扩展 HPC 集群容量

3月前浏览1475

本文摘要(由AI生成):

这篇文章的主要内容是介绍 Altair 为 Mellanox 提供的混合云计算解决方案。Mellanox 是一家为服务器、存储和超融合基础设施提供端到端以太网和 InfiniBand 智能互联解决方案的领先供应商。他们需要一个高稳定性的集群管理和调度混合云计算解決方案,以提高模拟速度和生产力。Altair 的解决方案包括 NavOps 和 Grid Engine,将计算密集型 HPC 工作负载迁移到云端,加快模拟速度并提高生产力,同时提高资源使用效率。该解决方案为 Mellanox 带来了缩短产品上市时间、提高资源利用率、实时洞察工作负载和资源利用率等优点。

 


主要看点

   



通讯设备(Communication equipment)


挑战:

Mellanox需要一个高稳定性的集群管理和调度混合云计算解決方案。


Altair 解决方案:

借助 Altair® NavOps®将计算密集型 HPC 工作负载迁移到云端,加快模拟速度并提高生产力。搭配Altair® Grid Engine®分布式资源管理系统,最大限度地跨本地、混合和云基础设施共享计算资源,提高企业投资回报率。


优点:

  • 强大的自动化功能可简化专用云和混合云爆发设置流程,以按需使用模式满足峰值性能需求。

  • 最大限度地跨本地、混合云基础设施共享计算资源,提高资源使用效率。

  • 提供对工作负载和衡量资源利用率的实时洞察,助力企业全面了解 HPC 云资源使用情况

  • 大幅缩短开发时间並在短时间提高收入与营利能力。


客戶介绍

   


Mellanox是一家为服务器、存储和超融合基础设施提供端到端以太网和InfiniBand智能互联解决方案的领先供应商。


世界上TOP500超级电脑中有一半使用Mellanox提供的解决方案,包括高性能网络和多核处理器、网络适配器、交换机、电缆、软件和硅片。


自1999年以来,结合高质量客户服务与持续创新推动了Mellanox的巨大增长。为推动进一步的成功,Mellanox团队需要在集群管理方法上进行创新并具备挖掘云计算资源的能力。

 

面临的挑战

—— Mellanox 面临 HPC 集群与混合云计算调度稳定性及运算性能提升问题


Mellanox需要一个可信赖的合作伙伴提供混合云调度解决方案。团队需要一个稳定高效的半导体设计工程集群——一个能够在本地高性能计算环境中表现一流的集群,并且在关键的开发周期可以透明地在微软Azure云上运行。


Mellanox HPC集群运算应用新一代产品开发的计算密集型EDA设计流程软件和仿真,因此卓越的工作负载编排至关重要


Mellanox过去曾经使用开源的作业调度程序,因此深刻了解企业级解决方案才能够提高稳定性和性能,并使团队能够使用高级功能以帮助团队保持领先的设计工作。


 

Altair® NavOps®按部门、用户和应用程序跟踪

和管理云支出


Altair 解决方案

——提高电子电路开发的效率和能力


在评估潜在的解决方案时,Mellanox团队针对性能、功能和成本各个面向进行评选,最终选择了Altair® NavOps®和Altair® Grid Engine®这两个经过验证的解决方案提供了最短的实施时间和领先的性价比指标


借助NavOpsMellanox团队的工作流程可以无缝地运用现有本地基础架构及混合云资源,最大限度提高效率,减少云资源支出。


   

通过将Altair® Grid Engine® 扩展到Microsoft Azure云,团队以非常经济高效的方式从混合云解决方案中获得几乎无限的计算能力,混合云方案在吞吐量和运算周期时间方面对我们的工程团队的益处是显而易见的。

—— Mellanox IT 企业计算服务 

高级经理 Doron Sayag 

 


借助Navops Launch,Mellanox可以提高内部部署数据中心的使用效率,同时通过云加速的“按需使用模式”方案满足本地无法负担的的峰值性能需求,这种混合模式通过Microsoft Azure增强了本地计算资源,能够同时运行所需要的计算数量,从而提高了工程团队的生产率


Altair® NavOps® 释放云迁移、自动化和支出管理资源

—— 提升HPC的云迁移、自动化

和支出管理能力


具备应用程序、资源和预算意识,可提供对工作负载和支出的实时洞察,并全面了解 HPC 云资源。


将复杂的自动化与云支出管理相结合,组织可以提高效率、降低云成本并缩短实现结果的时间,最终提高收入和盈利能力。


 

按需混合云扩展 HPC 集群容量


Altair® Grid Engine® 构建

现代 HPC 调度程序

—— 缩短设计时间和降低开发成本


分布式资源管理系统,优化数千个数据中心的工作负载和资源,提高性能并提高生产力和效率。


最大限度地跨本地、混合和云基础设施共享计算资源,帮助组织提高投资回报率并更快地交付更好的结果。

 

Mellanox为HPC集群提供强大的企业级调度和管理解决方案


关键结果

   


通过在高峰期间智能地利用云端资源,Mellanox技术团队缩短了产品上市时间,无需购买或维护其他基础设施即可获得计算资源,并通过可靠的企业级解决方案来管理其HPC集群资源,从而降低了使用成本。


Altair解决方案为Mellanox技术团队节省开发流程中三分之一的时间,并且在使用Altair® Grid Engine®和Altair® NavOps®两个财政季度内立即看到卓越的收益。


   

Altair技术支持非常专业,随时待命,愿意全力支持和改善Mellanox团队对软件工具使用问题。

—— Mellanox IT 企业计算服务 

高级经理 Doron Sayag 

 
 

Altair® Grid Engine®支持新框架并最大限度地

利用本地和云中的 GPU 资源

来源:Altair澳汰尔
HPC电路半导体电子芯片云计算Altair
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-03-24
最近编辑:3月前
Altair澳汰尔
澳汰尔工程软件(上海)有限公司
获赞 108粉丝 340文章 705课程 3
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈