文献解读 - 基准与方法研究 - 第十六期|《GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试》
关键词:基准与方法研究;基因测序;变异检测;
文献简介
标题(英文):Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis
标题(中文):GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试
发表期刊:BMC Genomics
作者单位:深圳真迈生物科技有限公司
发表年份:2022
图 1 文献介绍
GenoLab M 是 GeneMind Biosciences 最近开发的下一代测序(NGS)平台。为了确定 GenoLab M 的性能,研究者提出了一份报告,以对 GenoLab M 测序仪的 WGS 和 WES 测序数据进行基准测试,并将 GenoLab M 测序仪与 NovaSeq 6000 和 NextSeq 550 平台在各种类型的分析中进行比较。对于 WGS,来自 Illumina NovaSeq 平台并由 GATK 管道处理的 30×测序目前被认为是黄金标准。该数据集是作为本研究的基准数据的。
2014 年,瓶中基因组(GIAB)发布了金标准基因型数据集(包括参考样本 NA12878),为比较变异检测流程的差异提供了资源。最近,一些研究使用 GIAB 变异数据集来比较不同变异检测工具或测序平台。一般来说,WGS 和 WES 的数据深度分别在 30 倍和 100 倍以上。本研究获得了从多个测序平台生成的 NA12878 标准样品的 WES 和 WGS 数据集,包括 NextSeq 550,NovaSeq 6000 和 GenoLab M。
在分析部分,选择了两个管道:
Sentieon DNAscope 管道,基于机器学习(ML)的变体调用工作流(https://github.com/Sentieon/sentieon-dnascope-ml)和 DNAseq 工作流,这是一个加速的 GATK 重新实现。
测序流程
图 2 三个平台、两个分析流程比较流程图
图 3 GenoLab M 和 NovaSeq 6000 在 NA12878 样本 33X 和 22X 覆盖率下的变异调用性能比较。A SNP 和 B InDel 在全基因组上的表现,C SNP 和 D InDel F-score 在分层区域上的表现。精确度(阳性预测值)是检索到的实例中相关实例的比例,召回率(灵敏度)是检索到的相关实例的比例。F-score 是精确度和召回率的调和平均值,chr 20 表示 20 号染色体,NIADR 表示不在所有困难区域,SDR 表示片段重复区域。
在该研究中,GenoLab M 的平均 Q20 比 NovaSeq 6000 略低,但在相同的测序深度下,GenoLab M 重复率比 Novaseq 6000 低一半,并且 22×的 WGS 的准确度高于 22×NovaSeq 准确度,并达到了 33×NovaSeq 相似的性能。
图 4 Sentieon 的作用
Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至 2023 年 3 月份,Sentieon 已经在全球范围内为 1300+用户提供服务,被世界一级影响因子刊物如 NEJM、Cell、Nature 等广泛引用,引用次数超过 700 篇。此外,Sentieon 连续数年摘得了 Precision FDA、Dream Challenges 等多个权威评比的桂冠,在业内获得广泛认可。
文献讨论
图 5 文献结论
总结
综上所述,对于 WGS,GeneMind 测序平台中的 22X 与 Illumina NovaSeq 6000 33X 深度相似,这提供了一种有效的替代方案。而 GenoLab M 的 100X WES 在相同深度下表现出与 Illumina 平台相似或优越的性能,在 WES 中也具有应用前景。
评论