本文摘要(由AI生成):
这篇文章的主要内容是强生公司使用 Altair 的 Grid Engine 和 NavOps 解决方案来应对扩展计算容量和管理云布署的挑战。该方案实现了按需扩展计算容量、简化复杂的云基础设施布署,并支持多个复杂集群并行使用,提高了工作效率,缩减了上市时间,增强了强生公司在医疗行业中的竞争优势。
主要看点
行业:
医疗健康与制药
(Healthcare & Pharmaceutical)
挑战:
企业级事件需要大规模按需计算容量,以应对突发性运算峰值需求,加快研发速度,缩短上市时间,提高在医疗行业中的竞争优势。
Altair 解决方案:
Altair® Grid Engine® 支援最大限度地跨本地和云基础设施共享计算资源,按需扩展计算容量,Altair® NavOps® 实时监控管理复杂的云布署。
优点:
集群现有运行规模是过去的 3 倍
简化复杂的云基础设施布署,按需扩展计算容量
支持多个复杂集群并行使用,并可实时监控云资源应用配置
客户介绍
强生公司是世界上最大的医疗健康企业和财富 500 强中的 50 强公司,生产的药品、医疗设备和健康产品造福全球 10 亿人。强生公司旗下拥有一家以科学战胜疾病--杨森制药公司,研制了 1 剂型强生 COVID-19 疫苗,获得世界卫生组织批准该疫苗用于预防感染和挽救生命。这个以研究为导向的机构依靠高性能计算 (HPC) 来推动有效的、广泛可用的药物研发与生产制造流程。
面临的挑战
—— 强生公司面临扩展计算容量控制性及云布署问题
强生公司的研究性质需要大规模按需计算容量,并且能够在不再需要时轻松减少该容量,而这只能通过云基础架构来实现。强生公司在 Amazon Web Services (AWS) 上运行了 10 多个作业式 HPC 集群——同时提供給世界各地的科学家和开发研究人员使用,包括那些致力于研究强生公司 COVID-19 疫苗的研究人员 —— 并且寻找现成的解决方案(Altair® Grid Engine® 和云管理工具)来取代不再满足团队支持服务需求的供应商。
面对的挑战包括适应已经发展了十多年的现有基础设施和系统、复杂的网络设置以及集成到配置和变更管理系统的必要性。此外每个集群的配置都不同。
强生公司需要为其基于云的基础设施
提供合适的HPC 管理软件
Altair 解决方案
—— 按需扩展调度云资源提高作业流程效率
为克服强生公司面临之困境,Altair® Grid Engine®提供最大限度地跨本地、混合云基础设施共享计算资源,搭配Altair® NavOps® 简化复杂的云布署,并以自动化方式管理集群,以实时可视化方式监控资源使用情况,达到最极致的云规模。
Altair解决方案具有商业支持的现代化 Grid Engine 版本和管理多个集群的单个 NavOps 服务器,可与 AWS 云服务无缝集成。Altair的解决方案满足了强生公司的需求,自动创建和扩展集群、符合内部安全策略以及网络集成和合规性、商业和本地应用程序以及 GXP 合规性。包括用于资源分配的 cgroup、用于容器化工作负载的 Docker 集成和 REST API。最终强生公司获得了一个简捷、自动化兼具可扩展性的HPC 基础设施。
包括 Altair® Grid Engine® 和 Altair® NavOps® 在内的解决方案使我们能够在云中扩展并发展HPC 基础设施,以支持包括 COVID-19 疫苗开发在内的关键科学研究。
—— JOHNSON & JOHNSON 强生公司
高级计算经理 Martin Dellwo
借助 Altair 编排分层调度工具,强生公司可以在复杂的多组研发团队环境中按需扩展,在该环境中,每个研发团队都可以访问专门构建的集群。研究团队可以使用当前的配置组件根据需求快速轻松地创建额外的集群。Altair 的基础架构即代码解决方案包括完整的 UI/CLI/API 可配置性、灵活的配置和集成选项,以及对必要组件进行模板化和轻松编辑配置差异的能力。
Altair® Grid Engine®
—— 分布式资源管理与优化
▇ 高效工作负载管理:通过高效的工作负载管理降低硬件、软件和数据中心成本,从而通过减少等待时间、提高吞吐量和减少停机时间来提高用户工作效率。
▇ 广泛的应用支持:支持从生命科学和制造到能源、机器学习和人工智能等领域的数千种商业和开源应用程序。
Altair® NavOps® 助力强生公司最大限度提高工作效率,减少云资源支出
Altair® NavOps®
— HPC 的云迁移、自动化和支出管理
▇ 云支出管理:通过具有预算意识的支出管理来监控和控制成本。
▇ 云自动化:使用强大的自动化以无操作方式管理集群。
▇ 简化云操作:自动化功能简化现有运行流程,实现专有云或混合云爆发。
关键结果
Altair® NavOps® 支援动态创建和扩展Altair® Grid Engine® 集群,让强生公司能够持续进行医药研究创新。使用 Altair 解决方案消除了强生公司先前配置的可扩展性限制,并且集群现有运行规模是以往的 3 倍。随着 HPC 基础设施的可扩展性和敏捷性、运营、布署和管理的提高,研究团队可以按需进行科研作业调度,并灵活地处理企业级如 COVID-19 等高优先级事件。
Altair® Grid Engine® 为强生公司减少作业流程等待时间、提高吞吐量和减少停机时间来提高工作效率