写点什么

文献解读 -Chromosome-Scale Genome of Masked Palm Civet (Paguma larvata) Shows Genomic Signatures of Its Biological

作者:INSVAST
  • 2025-03-04
    广东
  • 本文字数:2572 字

    阅读完需:约 8 分钟

文献解读-Chromosome-Scale Genome of Masked Palm Civet (Paguma larvata) Shows Genomic Signatures of Its Biological

关键词:果子狸;基因组特征;变异检测;


文献介绍

  • 标题(英文):Chromosome-Scale Genome of Masked Palm Civet (Paguma larvata) Shows Genomic Signatures of Its Biological Characteristics and Evolution

  • 标题(中文):果子狸(Paguma larvata)的染色体规模基因组显示其生物学特征和进化的基因组特征

  • 发表期刊:Frontiers in Genetics

  • 作者单位:华大基因农业基因组学国家重点实验室、中国科学院大学生命科学学院等

  • 发表年份:2022

  • 文章地址:https://doi.org/10.3389/fgene.2021.819493

图 1 文献介绍


花面果子狸(Paguma larvata)作为一种独特的小型食肉动物,其杂食性饮食习性和作为多种病原体载体的特征引起了广泛的关注。特别是自 2003 年 SARS 疫情暴发以来,该物种作为 SARS 相关冠状病毒的潜在宿主,其重要性更加凸显。尽管目前该物种并未濒危,但其种群数量的持续下降趋势值得关注。


为深入理解花面果子狸的生物学特征,研究采用先进的单管长片段读取(stLFR)和 Hi-C 技术对其基因组进行测序和组装。研究团队选取一只雄性个体进行基因组组装,采集其 16 个组织进行 RNA 测序,并对 45 个个体(18 雄 27 雌)进行全基因组重测序,以获取全面的基因组信息。



测序流程

在研究数据处理中,研究团队使用 Sentieon DNAseq 进行变异检测,joint Calling;

图 2 Sentieon 的作用


Sentieon DNAseq 是一款商业基因组分析工具,其处理速度比 GATK 快 5-20 倍,30X WGS 样本从 FASTQ 到 VCF 的分析可在 1 小时内完成。


在保持与 GATK 相同分析准确性的同时,通过优化算法和资源管理大幅降低计算资源消耗。


支持包括 Illumina、PacBio HiFi 等多种测序平台,并集成了机器学习模型以提升复杂区域的变异检测准确性。


基因组分析结果显示,果子狸基因组大小为 2.42 Gb,包含 22 对高度完整的染色体,scaffold N50 达到 105.60 Mb。通过 BUSCO 评估,92.1%的哺乳动物保守基因被完整识别,充分证实了组装的优良品质。


图 3 本研究中果子狸基因组组装和染色体水平句法分析概览

(A) 组装基因组的基因组特征和变异图谱(500kb 窗口): a. 22 条染色体的群体规模π值 b. 每 500kb 窗口的 SNP 数量 c. 重复序列密度 d. GC 含量 e. 基因密度 f. 映射到基因组的读取深度

(B) 五个物种之间的 mRNA 长度、编码序列(CDS)长度、外显子长度和内含子长度的比较。x 轴表示长度,y 轴表示密度。

(C) 果子狸和家猫之间的染色体水平句法分析,使用 RectChr v1.27 可视化。

(D) 之前发表的核型研究中果子狸(P 染色体)和家猫(A-F 染色体)的比较染色体图。下带表示猫的染色体,上带表示果子狸的染色体。

(C)中发现的所有分裂和融合事件都可以在(D)中找到对应。假设核型分析中猫和果子狸的染色体关系是准确的,那么核型分析和句法分析之间的高度一致性表明我们组装的染色体规模基因组的高质量。


基因组注释过程中鉴定出 18,340 个蛋白编码基因,其功能注释覆盖率高达 99.96%。值得注意的是,研究首次精确定位了果子狸基因组中的性别连锁区域,包括 107.13 Mb 的 X 连锁区域(Chr22)和 1.34 Mb 的 Y 连锁区域(Scaf457),基因组特征的揭示为深入理解该物种的遗传结构提供了重要参考。


图 4 本研究中性连锁区域的鉴定

(A) 将家猫的 X 染色体基因定位到果子狸和家犬。

(B) 45 个重测序的果子狸个体的常染色体、X 连锁区域和 Y 连锁区域的读取深度。


比较基因组分析揭示了果子狸基因组中 314 个基因家族的扩张和 1,367 个基因家族的收缩。尽管未能直接观察到与杂食性相关的基因家族扩张,但通过深入分析发现 622 个受正选择基因,其中 ABCD3 和 CYP450 2U1 等基因可能在其饮食适应性进化过程中发挥关键作用。


图 5 比较基因组分析和扩张基因家族富集分析

(A) 20 个物种间的分歧时间估计。该树拓扑结构由 MCMCtree 使用 CDS 序列生成。红色和蓝色数字表示每个节点扩张和收缩的基因家族。插图通过改编 SMART 和 Vecteezy 模板创建。

(B) 果子狸基因组中 314 个扩张基因家族与其他 19 个物种相比的显著富集 KEGG 通路。


免疫系统研究发现多个重要免疫通路显著富集,包括 IL-17 信号通路和 NK 细胞介导的细胞毒性通路,这些发现为理解该物种的免疫防御机制提供了分子基础。通过对 ACE2 和 TMPRSS2/TMPRSS4 表达模式的分析,研究推测 SARS-CoV-2 主要通过消化道后段感染果子狸,这一发现对疾病预防具有重要指导意义。


图 6 与免疫系统相关的富集 KEGG 通路和 ACE2 及 TMPRSS2/TMPRSS4 基因的 RNA 表达谱

(A) 果子狸与其他 19 个物种相比的 622 个 PSGs 的富集 KEGG 通路。红色表示免疫相关通路;蓝色表示生殖相关通路;橙色表示疾病相关通路。 (B) 8 个与免疫相关的显著富集 KEGG 通路中的 PSGs 数量。

(C) 6 个与免疫相关的富集 KEGG 通路中扩张基因家族的基因数量。

(D) 与免疫、生殖和疾病相关的显著富集 KEGG 通路中 PSGs 的基因数量。某些基因在不同通路中共享。

(E) ACE2、TMPRSS2 和 TMPRSS4 基因在果子狸 16 个器官中的表达热图。Z-scores 根据三个基因的 TPM 值计算。基因表达从低(蓝色)到高(红色)着色。


种群遗传学分析表明,果子狸具有较高的基因组杂合度(H=0.4726)。通过 PSMC 和 SMC++分析方法重建的历史种群动态显示,该物种经历了复杂的人口波动,包括两次显著扩张和三次收缩。虽然最近一次种群下降发生在约 4 千年前,但目前的有效种群规模仍维持在相对稳定的水平,这为制定科学的保护策略提供了重要参考。


图 7 果子狸的基因组杂合度和种群历史

(A) 由 PSMC 估计的果子狸的人口统计学历史。

(B) 由 SMC++估计的果子狸的人口统计学历史。

(C) 果子狸和其他 36 个已发表物种的全基因组杂合度。这里使用的世代间隔和突变率分别为 2 年和 2.4×10-9。


Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。截至 2023 年 3 月份,Sentieon 已经在全球范围内为 1300+用户提供服务,被世界一级影响因子刊物如 NEJM、Cell、Nature 等广泛引用,引用次数超过 700 篇。此外,Sentieon 连续数年摘得了 Precision FDA、Dream Challenges 等多个权威评比的桂冠,在业内获得广泛认可。



总结

这项系统性的基因组研究揭示了果子狸的关键生物学特征和进化适应性,为理解其作为病毒宿主的分子机制提供了重要见解。不仅深化了对该物种的认识,也为人畜共患病防控提供了重要的科学依据。这些发现将推动野生动物保护、疾病预防和进化生物学等领域的发展,同时为后续的比较基因组学研究奠定了坚实基础。

用户头像

INSVAST

关注

还未添加个人签名 2023-07-04 加入

还未添加个人简介

评论

发布
暂无评论
文献解读-Chromosome-Scale Genome of Masked Palm Civet (Paguma larvata) Shows Genomic Signatures of Its Biological_基因检测_INSVAST_InfoQ写作社区