多组学联合分析+机器学习+创新的项目设计,一区10分高分精准复现

这是测试机器学习 + 多组学整合发高水平文章复现来了,这里编辑分析的一篇文献是机器学习 + 的微生物组 + 代谢组的高分文章复现。后期小编还会继续分享:机器学习,公开转录组和单细胞转录等数据,以及机器学习 + 预后风险模型预测等敬请期待。

1. 文章简介

  • 原文标题:Machine learning-causal inference based on multi-omics data reveals the association of altered gut bacteria and bile acid metabolism with neonatal jaundice
  • 中文标题:基于多组学数据的机器学习 – 因果推断揭示了肠道菌群和胆汁酸代谢改变与新生儿黄疸的关联
  • 期刊名:GUT MICROBES (IF:12.2)
  • 发表时间:2024 年 8 月
  • 相关技术:多组学技术 + 机器学习

2. 研究背景

新生儿黄疸(NJ),临床特征为血清中总胆红素(TBIL)水平升高。在大多数情况下,黄疸会自行消退。然而,一小部分婴儿可能会出现严重的高胆红素血症或胆红素脑病,如果不及时诊断和治疗,可能导致脑损伤或死亡。肠道微生物群在人类健康中起着重要作用,新生儿阶段这种微生物群的破坏可能对免疫系统的发育和成人健康产生重大影响,但目前其是否能作为 NJ 的早期识别指标还尚不清楚。

3. 研究方法

该研究共纳入 98 例新生儿黄疸(NJ)和 98 例健康对照(HC)新生儿样本,分为发现(n=68)和验证(n=30)两个阶段。在发现阶段,采用 16 S rRNA 基因测序技术和液相色谱串联质谱(LC-MS/MS)获得了 NJ 相关的肠道菌群组 – 代谢组数据分析;随后基于一种机器学习 – 因果推断方法,全面了解影响 NJ 的肠道微生物群和代谢物组成关联。在验证阶段,使用靶向代谢组学检测来确定肠道代谢物的组成。

该研究采用机器学习方法评估代谢物了在 NJ 分类中的重要性,并构建了基于肠道代谢物的 NJ 临床预测模型。

4. 主要结果

4.1 参与者信息和组成

4.2 NJ 相关肠道菌群网络模块分析

首先比较各组之间的肠道微生物多样性,结果显示 NJ 组的 Shannon 多样性指数显著低于 HC 组。然后,使用基于 16S rRNA 测序的分子生态网络(MENs)和可视化工具来揭示组间肠道微生物之间的相互关系。还发现性别和抗生素使用的差异对肠道微生物群落结构有显著影响。研究结果显示,肠道微生物群与 TBIL 之间存在显著的负相关性。

4.3 肠道微生物组 – 代谢组关联分析

通过 16 S rRNA 基因测序确定了肠道菌群的组成,并通过液相色谱 – 串联质谱(LC-MS/MS)代谢组学检测确定了代谢物的组成。基于微生物组关联分析,确定了 68 种肠道微生物和 48 种肠道代谢物在两组间具有显著差异。通过 PLSDA 分析,发现 NJ 相关的肠道微生物群、代谢物和胆汁酸可以区分两组。使用 Procrustes 分析,发现发现 NJ 相关的肠道微生物群组成和代谢物组成强烈相关。还通过典范对应分析(CCA)、冗余分析(RDA)和 Mantel 分析揭示了肠道微生物群与胆汁酸之间的强相关性。

4.4 机器学习方法发现与胆汁酸相关的细菌

通过 Lasso 机器学习方法研究与胆汁酸代谢物相关的肠道细菌。还评估了肠道微生物群丰度预测胆汁酸含量的潜力,并构建了反映肠道细菌与 NJ 相关胆汁酸之间复杂相互作用的网络模型。

4.5 NJ 相关细菌 / 胆汁酸代谢产物与血清 TBIL 水平相关

为了理解 NJ 相关肠道菌和胆汁酸代谢物的临床意义,热图展示了 NJ 相关肠道菌群 / 胆汁酸与 TBIL 存在不同程度的正 / 负相关。其中相关牛磺胆酸和胆汁酸衍生物甘油磷酸胆碱与血清 TBIL 水平呈显著负相关。通过 ridgeline 图和生存分析发现,在验证阶段,随着肠道胆汁酸 NorCA 和 THDCA 降低,NJ 组 TBIL 水平的增加更为显著。结果表明,肠道菌群可以通过影响胆汁酸代谢来影响 TBIL 水平和 NJ。

4.6 NJ 相关细菌 / 胆汁酸代谢产物对 NJ 的潜在因果影响

该研究使用因果中介分析评估了胆汁酸相关细菌、胆汁酸和核心临床指标之间的因果关系,分析结果显示,肠道细菌不仅影响 NJ 的临床标志物 TBIL、血清直接胆红素(DBIL)和丙氨酸氨基转移酶(ALT)的浓度,还通过影响胆汁酸水平影响 NJ 本身。此外,研究还发现胆汁酸代谢物通过调节 TBIL 水平在 NJ 中发挥作用。

4.7 NJ 相关细菌 / 胆汁酸代谢产物临床预测模型的构建

为了了解 NJ 相关细菌 / 胆汁酸代谢物的潜在临床应用,该研究使用 Lasso 机器学习筛选出了与 NJ 相关的九种肠道细菌和胆汁酸显著变量,并基于此构建了临床预测模型。研究还利用随机森林模型,进一步表明肠道胆汁酸是 NJ 的潜在生物标志物。

5. 文章总结

  • 多组学研究方法:采用微生物组 – 代谢组的多组学方法,而不是单一的组学方法,提供了对新生儿黄疸(NJ)影响因素的全面理解。
  • 机器学习与因果推断结合:使用机器学习方法和因果推断方法来分析肠道菌群与胆汁酸代谢之间的关联,以及它们与新生儿黄疸之间的潜在因果关系。
  • 临床预测模型的构建:基于肠道菌群和胆汁酸代谢物,构建了新生儿黄疸的临床预测模型,这有助于早期识别高风险个体。
  • 肠道菌群与胆汁酸代谢物的关联分析:揭示了与新生儿黄疸相关的肠道菌群和胆汁酸代谢物之间的密切联系。
  • 潜在的生物标志物:发现了与新生儿黄疸相关的肠道菌群和胆汁酸,这些可能作为新生儿黄疸的潜在生物标志物。

这篇文献整个研究思路非常清晰,如果您的课题想参考这篇文献复现,或者您正在研究代谢组 + 16S / 代谢组 + 16S + 转录组数据的深度挖掘与整合,或者有相关的课题需要设计,可以联系业务老师,我们可以协助您进行数据挖掘,助您实现数据价值的最大化。