《Multi-omics analyzes of Rosa gigantea illuminate tea scent biosynthesis and release mechanisms》论文精读
玫瑰茶香
论文连接:Multi-omics analyzes of Rosa gigantea illuminate tea scent biosynthesis and release mechanisms
introduction
Rosa gigantea(RG,大花蔷薇,濒危)作为现代茶玫瑰祖先
- 育种过程中过度关注花色的多样性,忽略了芳香特性,导致现代玫瑰普遍缺乏香气或具有单一香型。
- 消费者对无香气或单一香型的玫瑰产品不再满足,更倾向于追求带有祖先茶香的玫瑰,以及具备生物活性和多功能性的植物精油产品。
- 大花蔷薇对恢复茶香具有重要价值,但其野生种群已因过度开发而急剧减少,急需保护与遗传研究。
传统测序技术难以解决基因组复杂区域(如端粒和周围重复序列、核糖体DNA和串联重复序列)的组装问题。
目前已有的三种玫瑰基因组参考序列均不完整,无法支持茶香或黄色玫瑰的研究。
结合Nanopore超长读长测序和PacBio HiFi测序,可以克服这些复杂性,提供完整的端粒到端粒(T2T)基因组。
Result
A complete T2T reference genome for R. gigantea
- 组装T2T基因组:7个染色体,总长度549.76MB
- 发现候选着丝粒重复序列,159bp
- 解释一下这个图
- a Circos图 描述基因组信息
- 7 条染色体上以 500 kb 为间隔的基因特征的 Circos 图
- TRF (Tandem Repeat Finder)串联重复查找
- 一个区域内:重复序列/区域长度
- 两大主要的 LTR 逆转座子家族
- Gypsy 型长末端重复逆转座子(LTR-RT)
- Copia 型 LTR-RT
- 比较可以揭示基因组结构的演化规律
- b RG 组装的 Hi-C 染色质相互作用图
- 热图 染色质相互作用
- c 着丝粒和端粒在 7 条染色体上的位置
- 3号染色体短臂没有端粒
- d RgCEN159(蓝色)、着丝粒周围区域(红色)、Ty3/Gypsy(橙色)和 Ty1/Copia 重复元件(黄色)沿七条染色体的分布的 Circos 表示
- e 在 R. gigantea 染色体上使用 RgCEN159 寡核苷酸探针的 e FISH
- 定位着丝粒区域
- e f 是验证测序结果的
- f FISH 与 R. gigantea 染色体上的 45S rDNA 寡核苷酸探针
- 定位45S 核糖体 DNA(rDNA)序列
RG(T2T)品种基因组和RC(传统)基因组改进
- RG组装填补了RC组装中的33个间隙,这些间隙分布在整个基因组中。
- 在这些间隙区域预测了6个基因,表明使用RC作为参考基因组时,这些基因无法被识别。
- 其中包括COX1(细胞色素c氧化酶亚基1),这是一个已知的线粒体基因,参与被子植物中的水平基因转移
通过一些指标对比说明了一下RG的组装优势
T2T genome of a wild ancestral species contributes genetic diversity to the Rosa pan-genome
比较基因组学
基因数量增减和时间分析
系统发育树
- 基因组共线性分析
无间隙基因组提供了表征由于组装技术限制而可能遗漏的结构变异
结构变异特征
线性暗示两个物种来源与共同的祖先序列,有着相似的功能
基于相同的蛋白质编码基因集25,通过鉴定 Rosa 物种中共享的同线直系同源基因来表征进化上保守的基因组区域。在 33042 个泛基因家族中,5 个物种包含 22713–27229 个基因家族。共有 15703 个 (57.67–69.14%) 在所有物种之间共享,可能代表了 Rosa 物种复合体的核心基因集(补充图 1)。此外,还有 13981 个可有可无的基因家族和 3358 个物种特异性基因家族。值得注意的是,R. gigantea 拥有 1646 个物种特异性基因家族,明显多于其他 4 个 Rosa 物种的估计值。这表明 R. gigantea 的基因组可以为 Rosa 泛基因组提供额外的序列多样性。
参与苯丙烷生物合成的基因扩增有助于茶香味的进化
- 补充图9
- 与香气相关的基因在各条染色体上的定位
- 黄色:苯丙素/苯甲素代谢相关基因。
- 蓝色:萜类代谢相关基因。
- 与萜类生物合成途径相比,更多的酶基因来自苯丙烷/苯类化合物代谢途径内的串联或近端重复
- 在 chr1、chr4、chr6 上,可以看到多个黄色基因(苯丙素/苯甲素基因)紧密排列,暗示基因家族扩张
- 补充图10
- 854个扩增的基因家族的KEGG富集(前三的通路)
- Phenylpropanoid biosynthesis(苯丙素生物合成)
- 苯丙素类化合物是植物次级代谢产物的主要组成部分,涉及防御机制(如抗病性)和植物的香气及颜色形成。在玫瑰中,它与挥发性有机物(VOCs,如苯乙醇)以及花青素等色素的合成密切相关。
- Steroid biosynthesis(类固醇生物合成)
- Sesquiterpenoid and triterpenoid biosynthesis(倍半萜和三萜类生物合成)
- 倍半萜和三萜类化合物属于植物次级代谢产物,广泛参与防御反应、信号传递以及花的芳香形成。
- Phenylpropanoid biosynthesis(苯丙素生物合成)
- 推测可能与独特的茶香味有关
- 854个扩增的基因家族的KEGG富集(前三的通路)
因此重新构建了玫瑰(Rosa)中与挥发性有机化合物(VOCs)合成相关的苯丙素/苯甲素、萜类化合物代谢途径及其基因表达。
根据与茶香相关的主要香气成分,参与玫瑰苯类化合物合成的两条分支途径可能与 R. gigantea 的花香形成有关
- 补充图11:玫瑰(Rosa)中与挥发性有机化合物(VOCs)合成相关的苯丙素/苯甲素代谢途径及其基因表达
- 苯丙素/苯甲素代谢途径,显示了从L-苯丙氨酸(L-Phenylalanine)到不同代谢产物(VOCs)的转化过程
- 代谢路径
- 起始物质:
- L-苯丙氨酸作为代谢途径的起点,通过PAL(苯丙氨酸解氨酶)转化为肉桂酸(Cinnamic acid)。
- 主要代谢产物:
- 苯乙醇(2-Phenylethanol):通过AADC、PAR、AAT形成,赋予玫瑰芳香特性。
- 苯甲醛(Benzaldehyde):由苯丙酸等前体通过PPDC合成。
- 甲基水杨酸(Methyl Salicylate):通过SAMT合成,与植物防御和芳香有关。
- 愈创木酚类(Eugenol和Isoeugenol):通过EGS和IGS生成,与植物香气和抗菌性相关。
- 苯甲酸及衍生物(如甲基苯甲酸):通过BALDH、BAMT生成。
- 起始物质:
- 基因与酶
- (红色字体)每个代谢步骤都有对应的基因编码的酶,这些酶催化特定反应。
- PAL:苯丙氨酸解氨酶(起始反应)。
- C4H:肉桂酸羟化酶,生成对羟基肉桂酸。
- COMT 和 OMT:O-甲基转移酶,催化甲基化反应。
- AAT:醇乙酰转移酶,生成挥发性酯类(如苯乙酸乙酯)。
- 基因表达heatmap
- 控制这次酶合成的对应基因在不同玫瑰样本中的差异性表达,帮助识别关键基因:
- 高表达的基因(红色)通常是这些代谢产物(VOCs)合成的主要调控者。
- 例如,AAT、SAMT、PAR 的表达显著,表明它们在苯乙醇、甲基水杨酸等香气分子形成中起关键作用。
- 控制这次酶合成的对应基因在不同玫瑰样本中的差异性表达,帮助识别关键基因:
- 化合物结构(蓝色框)
- 路径中标出了主要VOCs的化学结构(例如苯乙醇、甲基水杨酸、愈创木酚等),明确了目标化合物。
- 这些挥发性分子是玫瑰香气的主要贡献者,也与植物防御或生态适应性有关。
- 补充图12:玫瑰(Rosa)中两种主要的萜类合成途径(MEP和MVA途径)如何产生多种萜类化合物及相关基因表达模式
- 开始解释
分析了OMT这个基因家族
代表性研究:
- DMT(3,5-二甲氧基甲苯)和 TMB(3,5-三甲氧基苯)是苯丙素/苯甲素代谢途径中重要的挥发性有机物(VOCs),它们对玫瑰花香形成具有关键作用。
- 在 R. gigantea 和 R. chinensis 的香气中,DMT 和 TMB 是特征性化合物,分别对应“茶香”和浓郁花香。
基因研究重点:
- 与 DMT 和 TMB 合成相关的 OMT(O-methyltransferase)基因家族具有显著的扩展和功能分化特点,研究它们有助于阐明基因复制、功能演化和代谢调控的关系。
- 基因表达和功能研究表明,OOMT 基因的扩展直接关联 DMT 和 TMB 的高产,因而被选为重点分析对象。
研究范围有限:
- 研究的目标是解析香气化合物的合成机制,而 DMT 和 TMB 是其中较为明确且影响显著的化合物。
释放茶香的组织特异性
peer review
第一个审稿人提出了两个比较大的问题,我在看文章的时候也发现前后两部分的关联性其实没有很强
- 文章前面介绍T2T的内容,和后面解析茶香机制和分析,两部分太过独立
Zhou等人的手稿报告了(i) Rosa gigantea(一种玫瑰品种)基因组序列的组装、注释及初步分析,以及(ii) 该物种中香气形成的生理、 生化和转录组学分析。这两部分内容在很大程度上是独立的。基因组学部分的技术方面方法论上是可靠的,并且描述得足够详细。如果这两部分内容能够更好地结合,例如通过对与香气相关的代谢物积累进行遗传分析,手稿的质量将更强。我不确定该手稿对普通读者的吸引力如何。我发现整体主题(玫瑰中的茶香)很吸引人,但手稿的性质相当技术性,且第二部分报告的结果在我看来是初步的,生化观察与特定基因之间的联系充其量是推测性的。
- Response:先说一下自己在哪里已经分析了这些东西,然后说自己增添了内容来进行二者关联分析的补充。对于,生化观察与特定基因之间的联系充其量是推测性的问题说自己实验做的不足,然后就补充了相关的东西,说自己已经尽力补充了啥啥的
首先,非常感谢您对基因组学部分给予的积极反馈。众所周知,Rosa gigantea(R. gigantea)是现代玫瑰品种茶香的重要祖先,该玫瑰物种的T2T级基因组组装和注释是深入阐明玫瑰花香起源、演化和调控的前提,尤其是茶香。基于最高质量的R. gigantea基因组,我们分析了与茶香相关的基因(如EGS、IGS、OOMT和POMT基因)的鉴定和演化,并在R. gigantea和R. chinensis ‘Old Blush’中构建了负责茶香时空释放的网络,如结果部分3.4-3.6节(图4-7)所示。因此,高质量的R. gigantea基因组为破解迷人的玫瑰茶香之谜铺平了道路。
其次,我们同意您的意见,即在之前的版本中,基因组学部分与香气形成的生理、生化和转录组学分析部分在很大程度上是独立的。为了连接这两部分,我们重新组织并添加了一些图表,从我们的角度来看,逻辑性有所增强,请查阅当前手稿中的修订内容,并期待您的进一步建议。正如您所说,生化观察与特定基因之间的联系充其量是推测性的。为了解决这一缺陷,我们尽力进行了额外的实验。我们发现候选基因的表达和序列与转录组数据和代谢物一致(补充图22-23)。此外,我们还进行了瞬时转染质体实验,以验证转录因子与基因结合的可能性(补充图24-25)。相关的发现、实验方法和参考文献已添加至手稿的第335-348行和第816-859行。
不幸的是,R. gigantea原产于中国云南省,距离我们的大学较远,且该物种通常在野外生长并在单一季节(3-4月)开花,因此我们不得不花费大量时间等待所需样品的收获。当收到您的意见后,我们计划进行更多实验,以提供更多证据证明生化观察与特定基因之间的预测联系是合理的,目前正在进行茶香生物合成途径中蛋白质的催化功能研究,以及负责这些茶香相关基因的转录因子的确认。然而,这些结果需要更多时间完成,而截止日期临近,我们决定先提交当前版本供审稿人审阅,正在进行的结果将在必要时的后续修订中提供。实际上,玫瑰的花香调控网络非常复杂,在有限的时间内彻底理清这一网络具有挑战性
- 文章分析了OOMT这个基因家族,但是扩张的别的基因家族跟这个茶香是否有相关
我们理解您的担忧。我们通过对13个玫瑰物种的系统发育分析提出了假设。结果显示,在R. gigantea中,苯丙烷生物合成在854个基因家族扩张中显著富集,这与独特茶香VOCs的合成途径相关。然而,苯丙烷生物合成途径是复杂的,扩张的基因家族位于特殊茶香VOCs合成途径的上游,包括三个PALs、三个4CLs、六个CCoAOMTs和八个COMTs。然而,上游基因的扩张也会影响其他性状,如黄酮生物合成,其对挥发性苯丙烯醛生物合成的实际影响需要进一步研究和验证。与DMT和TMB合成相关的RgOOMTs数量增加显示了它们在VOCs积累中的潜在作用。因此,我们修订了第20-21行和第150-151行(红色标注),以避免结论过于牵强。