写点什么

文献解读 -LettuceGDB: The community database for lettuce genetics and omics

作者:INSVAST
  • 2025-05-08
    广东
  • 本文字数:2385 字

    阅读完需:约 8 分钟

文献解读-LettuceGDB: The community database for lettuce genetics and omics

引言

生菜是我们餐桌上常见的蔬菜,但您是否了解过它背后丰富的生物学特性?因此,研究团队构建了一个综合性的生菜数据库平台,整合了包括基因组、重测序、转录组、miRNA 组、代谢组和表观基因组在内的多组学数据。这个数据库不仅为科研人员提供了宝贵的研究资源,也让我们得以从分子层面深入认识这种常见的蔬菜。


文献介绍

  • 标题(英文):LettuceGDB: The community database for lettuce genetics and omics

  • 标题(中文):生菜 GDB:生菜遗传学和组学的社区数据库

  • 发表期刊:Plant Communications

  • 作者单位:北京农林科学院、北京农业生物技术研究中心等

  • 发表年份:2023

  • 文章地址:https://doi.org/10.1016/j.xplc.2022.100425

图 1 文献介绍


生菜(Lactuca sativa)作为全球重要的叶菜类蔬菜和菊科模式植物,在叶发育研究、代谢途径分析和生物医药生产等领域具有重要应用价值。近十年来,高通量测序和表型组学技术产生的生菜多组学数据快速增长,但数据分散存储难以有效利用。因此,构建整合多维数据的 LettuceGDB 数据库对促进生菜科学研究和育种具有重要意义。


测序流程

在数据处理过程中,研究团队使用 Sentieon 变异检测流程进行变异位点的鉴定。

图 2 Sentieon 的作用


毅硕科技提供一站式定制化的基因组数据分析服务,涵盖从比对到变异检测全流程;Sentieon 通过对开源工具的算法重新实现,在保持结果高度一致性的同时显著提升了运行效率,分析速度提升数倍;从而缩短了项目分析周期,能更快更精准的将变异检测结果交付到您的手上,助力您加快科研进度。


LettuceGDB 是一个综合性的生菜基因组数据库,其架构包含数据、功能和工具三个核心组成部分。数据库整合了十种不同类型的公共数据集和 LBG 数据,包括两个重要参考基因组:结球莴苣(L. sativa cv. Salinas)和茎用莴苣(L. sativa cv. YL1),以及四种代表性生菜类型的泛基因组数据。数据库还收录了来自 1048 个生菜品种的重测序数据、1300 多份种质资源信息、关键性状的批量表型数据、256 个 RNA-seq 数据集、基于 sRNA-seq 和 PARE-seq 的完整 miRNA 组注释、代谢信息和基因组范围染色质可及性景观的表观遗传数据,以及近十年发表的生菜研究论文。


图 3 LettuceGDB 的三个组成部分框架


在基因组和基因型方面,LettuceGDB 收录的重测序数据包含超过 7000 万个 SNP 和 500 多万个插入缺失变异,这些变异影响了 35,000 多个功能基因。数据库开发了五个主要功能模块:基因组、基因型、种质资源、表型和 O-组学,使用户能够便捷地访问和分析各类数据。其中,Search Gene 工具支持基因序列检索和可视化,Gene Annotation 工具提供全面的功能注释信息。


图 4 LettuceGDB 的基因组和基因型功能

(A) 系统发育树展示野生和栽培生菜之间的关系。LettuceGDB 中可获得的两个基因组用深青色标注。

(B) LettuceGDB 的 Search Gene(基因搜索)页面。

(C) 使用 InterProScan 注释蛋白编码基因的示意图。

(D) 基于 1048 个重测序数据集结果的变异检索系统。


在种质资源与表型数据方面,数据库收录了 1300 多份种质资源的详细信息,包括品种特征、来源和生物学特性等。同时整合了 200 多个农艺性状、品质特征和抗性等表型数据,这些数据通过手动或表型组学平台收集,为生菜育种和研究提供重要参考。O-组学模块则整合了转录组、miRNA 组、代谢组和表观组等多维度组学数据。


图 5 LettuceGDB 的种质资源和表型功能

(A) 饼图展示 LettuceGDB 中各类型生菜种质资源的比例。

(B) 世界地图展示生菜种质资源的全球分布和统计信息。青色表示收集国家或地区,深青色圆圈显示美国的一个示例,其中展示了详细的种质资源信息。

(C) LettuceGDB 的生菜种质资源检索系统。

(D) 展示特定生菜品种种质信息和表型记录的详细页面。

(E) LettuceGDB 的转基因生菜种质资源界面。


图 6 LettuceGDB 中手动收集和高通量表型组学平台获得的表型数据

(A) 展示 LettuceGDB 中手动测量的三类性状的示意图。

(B) 展示不同生菜品种株高比较的示例。

(C) 实验中使用的高通量表型组学平台示意图。

(D) 使用高通量表型组学平台连续记录的 C978 生菜的六个表型。 PA,投影面积;PP,投影周长;CA,凸面积;CP,凸周长;PCD,投影外接圆比率;PPR,投影面积周长比。


为提升用户体验,LettuceGDB 整合了八个专业分析工具,包括 Assembly Converter、Search Gene、BLAST、JBrowse、Primer Design 和 Gene Annotation 等基因组学分析工具,以及 Tissue Expression 转录组数据展示工具。用户可通过 Literature 和 Data 工具搜索文献并访问不同类型的数据。此外,数据库还配备了浏览器、搜索引擎、过滤器等辅助功能,并建立了促进用户交流的社区平台,为生菜基因组学研究和分子育种提供了强有力的支持。


图 7 LettuceGDB 工具和社区的示意图

(A-G) BLAST(A)、JBrowse(B)、基因表达(C)、引物设计(D)、文献(E)、数据(F)和社区(G)在 LettuceGDB 中的展示。


Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。截至 2023 年 3 月份,Sentieon 已经在全球范围内为 1300+用户提供服务,被世界一级影响因子刊物如 NEJM、Cell、Nature 等广泛引用,引用次数超过 700 篇。此外,Sentieon 连续数年摘得了 Precision FDA、Dream Challenges 等多个权威评比的桂冠,在业内获得广泛认可。


总结

图 8 文献讨论


LettuceGDB 旨在成为莴苣多组学数据的中心,促进知识和信息共享。数据库还收集和组织了文献和社区工具中的信息,并总结了莴苣的前沿研究。构建 LettuceGDB 的目的之一是推动莴苣育种进展。尽管当前版本的 LettuceGDB 仍有许多限制,但研究团队希望更多人能参与 LettuceGDB 的建设,分享更多研究结果、数据和种质资源。


总之,LettuceGDB 旨在成为一个重要的莴苣育种数据中心,为研究人员和育种者提供丰富的数据和便捷的访问,从而加速莴苣育种实践,推动莴苣研究和育种的进步。

用户头像

INSVAST

关注

还未添加个人签名 2023-07-04 加入

还未添加个人简介

评论

发布
暂无评论
文献解读-LettuceGDB: The community database for lettuce genetics and omics_基因测序_INSVAST_InfoQ写作社区