首页/文章/ 详情

【成功案例】Altair HPC助力维康桑格研究所深入探索基因序列传递途径的I/O分析

8月前浏览1075

本文摘要(由AI生成):

这篇文章主要介绍了 Altair 为维康桑格研究所提供的解决方案,包括 Altair Mistral™和 Altair Breeze™ 两款工具,旨在解决研究所面临的大量数据存储、共享和处理问题。通过使用这些工具,维康桑格研究所成功优化了其基因组管道,提高了作业流程效率,节省了时间和成本。


 


主要看点

   



生物医学研究机构

(Biomedical Research Institute)


挑战:

庞大的研究数据存储性能、共享便利性及数据卫生至关重要,提高本地及云端计算群集作业效能及制定战略迁移策略成为首要解决难题。


Altair 解决方案:

借助 Altair Mistral™达到高效优化I/O 运行模式,并辅以Altair Breeze™ 分析 Amazon Web Services (AWS) 云中的容器化工作负载,为维康桑格研究提供自动化云战略。


优点:

  • 大幅缩短运行时间,节约时间成本

  • 优化混合云的本地工作负载,跨平台控制云中成本,为投入资源提供最大化收益

  • 检测恶意作业和不良 I/O 模式,并实时跟踪应用程序 I/O,提供详细作业指标


客户介绍

   

维康桑格研究所是世界上首屈一指的基因组学和遗传学研究和试验中心之一。秉持着不凡的决心在全球范围内开展合作,为先驱研究和变革性医疗保健创新奠定基础。研究所的癌症基因组计划使用高通量基因组测序来识别体细胞获得的突变,旨在表征人类肿瘤中的癌症基因、突变过程和克隆进化模式。

 


面临的挑战

—— 维康桑格研究所面临庞大数据的存储及共享瓶颈


根据英国癌症研究中心的数据,1960 年以后出生的人中,每 2 人中就有 1 人会在一生中的某个阶段患上癌症。开展基因组项目以寻找治疗方法是必要的,而维康桑格研究所处于基因组研究的前线。此类项目产生的数据量庞大,每个癌症样本经过初步处理后会产生约 250GB 的数据。由于需要大量数据存储,因此优化至关重要


维康桑格研究团队需要使癌症传递途径具有可迁移性并针对云部署进行调整。大多数管道都是在本地机器上编写和测试的,然后在具有共享存储的计算集群上并行运算。然而集群上的 I/O 行为犹为不同,除非生物信息学家可以使用综合 I/O 分析工具,否则可能存在低效的 I/O 模式,这些模式会损害存储性能并可能影响其他人完成工作。


 

维康桑格研究所使用 Mistral 和 Breeze 进行I/O分析,优化其基因组管道,并减少开支


Altair 解决方案

—— 按需扩展调度云资源提高作业流程效率


维康桑格研究所使用 Altair Mistral™ 来分析传递途径并寻找低效的 I/O 模式。传递途径已在某些方面进行了优化,但 Altair Mistral 表示需要进一步改进 。查明了大量的小读取——每秒高达 100 万次 1 字节的读取——这会损害计算性能并在共享存储上创建次优的 I/O 模式。优化小读取允许存储以最大带宽运行,而对其他作业的影响最小。研究团队还使用 Altair Breeze™ 来分析 Amazon Web Services (AWS) 云中的容器化工作负载,并且Altair Breeze 确定默认存储选项比更快、更昂贵的选项更有价值。


 

Altair Breeze™ 助力维康桑格研究所快速解决软件部署问题并解决文件和网络依赖关系


   

改善运行时间通常不需要将原有代码推倒重写,知道核心问题点是关键。

—— 维康桑格研究所 癌症研究员

Keiran Raine

 


Altair Breeze™

—— 详细的依赖分析和 I/O 分析


 透视数据健康:跟踪应用程序依赖性以确保良好的数据健康,创建访问清单,并解决部署问题或证明部署的正确性。


▇ 战略迁移:为下一次迁移策略提供宝贵的信息,并提供依赖项列表来解决安装问题并将应用程序轻松迁移到云或容器平台。


 

Altair Mistral™ 为维康桑格研究所提供详细的作业指标,有效提高资源使用率


Altair Mistral™

— 实时系统遥测和 I/O 监控


 详细作业指标:量测CPU、内存和 I/O,收集每个作业、每个用户和每个主机的指标,按作业和文件系统细分。


安全存储保护:检测恶意作业和不良 I/O 模式,例如过多的元数据、随机 I/O 和少量读取和写入,以快速查找和消除有问题的应用程序。


 商业智能: 提供操作遥测和商业智能,以确保您的基础设施高效运行,并为明天做好计划。



关键结果

   

通过使用 Breeze 和 Mistral I/O 分析工具,维康桑格研究所在复杂且高价值的项目中节省了时间和金钱。研究团队发现在不影响性能的情况下,选择更便宜的存储选项可以节省 10% 的项目成本。此外,运行时间从 32 小时减少到 18 小时。分析工作使研究所的团队能够通过使用大量内存、I/O分析文件和避免小的读取和写入来优化其传递途径。当扩展到并行运行的全基因序列组时,速度和成本节约变得越来越重要,团队投入了大量精力来调整传递路径并使其可移植和易于运行,但团队的工作变得更加轻松容易,因为只有通过使用正确的工具进行遙測才能更轻易的获取更好的结果。


 

维康桑格研究所借助 Mistral 和 Breeze 实现快速、敏捷和云就绪

来源:Altair澳汰尔
HPC控制试验Altair
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-03-24
最近编辑:8月前
Altair澳汰尔
澳汰尔工程软件(上海)有限公司
获赞 142粉丝 475文章 743课程 4
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈