阿里云 E-HPC+i4p 大内存实例,加速寻因生物单细胞数据分析效率
寻因生物是一家专注于单细胞技术的生物科技企业,拥有自主研发的微孔芯片与油包水双技术单细胞捕获平台,致力于通过国产高通量单细胞全链条产品及服务,将单细胞技术普适化应用于临床及药物研发,助力相关疾病研究。
单细胞测序技术呼唤更高计算性能
自单细胞测序技术问世以来,先后被 Nature Methods 评为年度技术,被 Nature 评为最值得期待的生物技术之一。相比于传统的检测技术,单细胞技术以细胞为研究单位,用更高的分辨率揭示个体的发育及疾病发生发展的机制。
更高的分辨率就意味着单细胞测序数据分析时需要更高的计算资源(更高的内存占用和 CPU 占用)。还要求数据分析人员有良好的编程基础、各种软件包的管理能力和较强的数据挖掘能力等,学习成本较高,这就导致了数据分析的通量和能力成为了单细胞技术快速成果转化的瓶颈。
阿里云 E-HPC+i4p,加速寻因生物数据分析效率
为了提升数据分析的效率、简化用户操作流程,寻因生物基于千余项目实战经验自主研发出 SeekSoul Online 单细胞在线生信分析云平台。
该平台部署在阿里云 i4p 持久内存型实例中,并在实例中使用了 Memory Machine 大内存软件,不但完全消除磁盘读写带来的 I/O 瓶颈,还使得数据加载和导出时间从 1000 秒缩至 2.5 秒,任务的并发能力提升了 5 倍以上。同时,搭配的阿里云弹性高性能计算平台(E-HPC),通过统一调度不同规格云服务器,自动在业务高峰时扩容、低谷时释放,避免了资源浪费,有效保证项目周期。
寻因生物生信数据科学家马兴勇表示:“正是在这些技术的加持下,让我们的 SeekSoul Online 单细胞在线生信分析云平台可以集成多款高耗资源软件,数据库等,通过快速处理大规模单细胞测序数据,实现从单细胞数据质控到下游分析,再到个性化分析,一站式、可交互式单细胞数据分析操作。真正实现了将单细胞测序技术与 IT 基础设施结合在一起,达到了 1+1>2 的效果。”
点击这里,了解阿里云高性能计算平台 E-HPC。
版权声明: 本文为 InfoQ 作者【阿里云弹性计算】的原创文章。
原文链接:【http://xie.infoq.cn/article/5016af1b73cf8d60ef0e3b9dc】。文章转载请联系作者。
评论