【代谢组学】代谢组学与其他组学数据的整合

网上有关“【代谢组学】代谢组学与其他组学数据的整合”话题很是火热,小编也是针对【代谢组学】代谢组学与其他组学数据的整合寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题 ,希望能够帮助到您。

主要内容:

1.多组学数据整合概述

2.主要分析软件汇总

3.数据预处理的方法

1.多组学数据整合概述

1.1?多组学数据整合的现实意义

在研究疾病和其他性状或扰动的分子机制时,在一个以上的组学平台上进行分子分析是一种常见的做法。?

意义:多组分平台数据的整合分析为生物系统提供了更全面的分子特征,有可能改进疾病分子机制的发现以及诊断和预后预测模型 。?

目的:整合分析主要是为了更好地确定不同类型的生物分子是如何关联的(例如 ,代谢数量性状位点(mQTL)分析),为了确定与表型或疾病结局显著相关的分子途径,或者提高预测性能 ,例如,在生物标记物发现和诊断或预后应用的情况。?

如果数据集不是从同一个人那里收集的,那么跨组学数据集的整合分析的范围也是有限的。

2.?分析使用的原材料

2.1?可以参与分析的“材料 ”

1.软件:所有可以进行统计分析和数据可视化的软件都可以使用(例如 ,R) 。?

2.计算资源:原则上,所有分析都可以在功能相当强大的台式计算机上进行,尽管建议在某些分析中使用更强大的计算资源 ,例如计算服务器。?

3.研究设计:主要考虑匹配样本研究设计 ,在多元分子表型(-omics)平台上分析来自相同个体的生物样本。例如,在匹配样本设计中,单个血液样本可以分成两份 ,其中一份在代谢平台上分析,另一份在转录平台上分析 。然而,匹配样本设计可以基于同一生物样本小份体液 ,但也可以不一定要基于,例如在同一时间点从同一个人采集的血液样本和另一组织活检样本,即匹配。

4.预处理。分析中使用的数据集需要适用于特定分子分析平台的标准方法先行进行预处理 ,包括质量控制和排除潜在异常值和/或非典型观测 。

3. 数据分析的方法

3.1?mQTL分析:代谢特性的遗传驱动因素

描述遗传变异(通常以单核苷酸多态性(SNPs)的形式)与代谢产物丰度之间的统计关联,为理解代谢的遗传驱动因素提供了手段。mQTL分析需要来自相同个体的代谢谱数据和基因分型数据(SNP阵列或DNA测序数据)。基于群体的mQTL研究采用类似于全基因组关联研究的统计方法,不同之处在于表型响应变量是代谢丰度 。mQTL分析通常是通过全基因组的单变量关联分析进行的 ,通常假设一个附加的遗传模型,其遗传效应主要由等位基因的数量编码 。对于每个代谢物或代谢特征,进行全基因组扫描 ,以测试与遗传变异的关联。mQTL分析的结果是关于影响代谢丰度的候选基因驱动因素的信息。

3.1.1?mQTL分析过程

1.预处理和质控SNP分析数据 ,去除具有低质量位点和具有次等等位基因频(MAF)的变体;

2.预处理和质控代谢组数据(取决于平台和样本类型);?

3.对于每一对代谢物—遗传变异位点:?

a)拟合一个统计模型来检验代谢物-遗传变异的关联 。通常使用线性模型,以代谢特征为响应变量,以遗传变异和相关协变量(如性别、年龄、批次)为预测变量;?

b)对与遗传效应有关的模型参数进行统计零假设检验(如Wald检验或似然比检验) ,以确定p值

c)保存与每个遗传变异-代谢物对儿的遗传效应相关的p值(和相关参数估计)。

4.调整保存的p值向量以进行多次测试,例如基于错误发现率(FDR)的方法。?

5.使用FDR调整的p值和可接受的FDR水平(通常<0.05)确定哪些mQTL模型具有统计显著性 。

6.对于重要的mQTL模型,对模型执行额外的质量控制(高杠杆点 ,检查残差分布),以确保没有异常值或其他非典型观测影响结果。?

7.以表的形式展示结果,表中列出了重要的SNP-代谢物对儿 ,并展示了排名最高的重要模型。典型图表类型包括曼哈顿图,对于每个重要的代谢物-SNP对儿,绘制代谢物丰度与主要等位基因数(通常编码为0 、1或2)的比较 。?

8.重要mQTL变异的功能解释可以通过确定变异体是否位于基因的编码区来进行 ,这将表明该基因与相关代谢物之间的功能关系。如果变异体不位于基因的编码区,则可以基于与mQTL变异的基因组距离来确定候选功能基因,在mQTL变异体附近定位的基因将被视为主要功能候选基因。

3.2?基于代谢途径的整合分析

代谢途径分析提供了一种方法来确定特定的分子路径或生物过程是否与特定的生物扰动相关 ,如疾病状态 。?

代谢途径分析提供了一个将更广泛的生物学功能分配给分子层面的机会 ,并且可以帮助对研究结果进行生物学解释。?

进行代谢途径分析的两个最常见的框架是基于过度代表(OR)(或)或基于秩的假设检验。?

这里我们采用基于秩的检验方法,其中基因集富集分析(GSEA)是在转录组数据背景下进行代谢路径分析的一个常见例子,它也可以应用于代谢组数据 。使用GSEA或OR分析的途径分析也可以通过结合代谢组学和转录组学数据来进行 ,好处是从这两种数据类型中收集信息以确定代谢途径富集程度 。?

代谢途径分析的结果是基于代谢组学和转录组学数据中的证据,给出关于哪些分子途径与所研究的表型相关的信息。

3.2.1?代谢途径分析过程

1.使用平台特定的方法对转录组和代谢组数据进行预处理和质控。?

2.将代谢物标识符分配给轮廓代谢物,然后可以将其映射到生物途径 。我们假设转录组数据已经有了带有变量标准标识符的注释信息(例如 ,Ensembl、Entrez或基因ID),它们也可以映射到路径。?

3.对每个带注释的代谢物和每个转录组变量进行单变量关联分析,以确定它们与感兴趣的表型或结果的关联 ,例如病例-对照状态。在基于秩的(GSEA)分析中,秩是由每个变量的估计效应大小(例如,固定效应模型中的系数)决定 。在OR分析中 ,重要的代谢物和/或基因集合由每个变量的统计零假设检验确定。

4.分别使用转录组和代谢组数据进行途径富集分析,例如GSEA,并存储与每个路径相关的p值。?

5.结合来自转录组和代谢组数据代谢途径丰度证据 ,确定两个数据集的组合路径显著性 。可以使用基于排列的测试来确定显著性。?

6.以表的形式显示结果 ,表中列出了与p值和FDR调整p值相关的重要途径。

3.3 结合代谢组学和其他组学数据进行预测建模

预测建模,例如分类或回归,是生物医学研究中的一个共同目标 ,可以针对疾病诊断、亚型或预后等的预测 。?

有时,这种模型的预测性能可以通过包含一种以上的分子表型(-omics)数据来提高。

如果额外的数据(即额外的分子表型)有助于提供补充与预测感兴趣的结果相关的信息,则预期会出现改进的预测性能。如果预测性能没有得到改善 ,这意味着添加的数据要么根本不是预测性的,要么只是在第一个数据集中捕获的内容上提供冗余信息 。?

这项分析的结果是哪个分子表型平台提供了最好的预测信息,如果差异在统计学上是显著的 ,并且如果两种分子层面数据的联合(组合)建模提供了一个改进的预测模型 。

3.3.1 预测模型过程

1.预处理和质控代谢组学数据和从同一个体收集的额外分子数据,例如转录组数据。

2.选择适合高维数据的多元预测模型(如PLS 、OPLS-DA或lasso)。在后续步骤中使用此模型 。?

3.应用(嵌套)交叉验证优化模型参数并评估预测性能,或使用外部测试集评估预测性能。在分类的情况下 ,受试者工作特征曲线(ROC)和ROC曲线下面积(AUC)通常用于确定分类性能。分别基于各分子表型平台的数据评价模型的预测性能 。?

4.基于来自两个分子分析平台的数据优化和评估模型的预测性能(参见步骤3),在这两个平台上,数据通过变量的直接连接进行组合。

5.比较单个数据集和组合数据集之间ROC曲线和ROC-AUC的差异。如果需要 ,统计零假设检验可用于确定ROC-AUC估计值是否存在显著差异 。?

6.可用于未来数据预测的最终预测模型使用优化模型参数(步骤3和4)使用数据集中的所有观测值进行拟合 ,而不是基于交叉验证训练集拟合的模型。?

7.以表格的形式呈现结果,表中分别包含每个数据和组合模型的交叉验证(或外部测试集)的AUC估计值。另外还包括相应ROC曲线的可视化和与AUC值比较相关的假设检验p值 。

关于“【代谢组学】代谢组学与其他组学数据的整合”这个话题的介绍,今天小编就给大家分享完了 ,如果对你有所帮助请保持对本站的关注!

本文来自作者[一条小晨萱]投稿,不代表天七号立场,如若转载,请注明出处:https://net7.cc/tianqi/688.html

(1)

文章推荐

  • 金融风险的九大风险

    网上有关“金融风险的九大风险”话题很是火热,小编也是针对金融风险的九大风险寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一家金融机构发生的风险所带来的后果,往往超过对其自身的影响。金融机构在具体的金融交易活动中出现的风险,有可能对该金融机构的生存构成威胁;具

    2026年03月05日
    6302
  • 云南玉溪市元江县客运站有没有直达云南曲靖客运站的客车?

    网上有关“云南玉溪市元江县客运站有没有直达云南曲靖客运站的客车?”话题很是火热,小编也是针对云南玉溪市元江县客运站有没有直达云南曲靖客运站的客车?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。截止2016年10月,元江县没有直达曲靖的大巴,建议乘坐大巴到玉溪

    2026年03月06日
    11302
  • 梅州至韶关市仁化有多少公里

    网上有关“梅州至韶关市仁化有多少公里”话题很是火热,小编也是针对梅州至韶关市仁化有多少公里寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。梅州至韶关市仁化全程约473.7公里?梅州市?1?梅州市内驾车方案详情1)从起点向正西方向出发,沿新中

    2026年03月06日
    8303
  • C616车床主轴箱传动齿轮系的传动比

    网上有关“C616车床主轴箱传动齿轮系的传动比”话题很是火热,小编也是针对C616车床主轴箱传动齿轮系的传动比寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。机床机械传动要由以下几部分组成: (l)定比传动机构具有固定传动比或固定传动关系的传功机构,例如前面

    2026年03月06日
    5304
  • 板子泡在水里和用水煮的区别

    网上有关“板子泡在水里和用水煮的区别”话题很是火热,小编也是针对板子泡在水里和用水煮的区别寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。粘合度不一样。通过水煮让胶水快速软化,考验胶水是否耐水,再经过烘干考验胶水耐变形能力。专业来说,树木的细胞,吸收水分—释放

    2026年03月06日
    7304
  • 金融科技专业主要学什么课程 未来从事什么工作

    网上有关“金融科技专业主要学什么课程未来从事什么工作”话题很是火热,小编也是针对金融科技专业主要学什么课程未来从事什么工作寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。金融科技专业主要学金融科技概论、自动化数据处理技术、互联网金融风险管理、第三方支付与

    2026年03月06日
    4317
  • 高二450分高三还能提多少分

    网上有关“高二450分高三还能提多少分”话题很是火热,小编也是针对高二450分高三还能提多少分寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。高二阶段能考450分,只要用对了学习方法,并力求勤字当头,那么想要在高考的时候进步一些分数,并不难。

    2026年03月06日
    7318
  • 河南实验二中东那个班是重点班

    网上有关“河南实验二中东那个班是重点班”话题很是火热,小编也是针对河南实验二中东那个班是重点班寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。竞赛班。根据查询河南省第二实验中学官网得知,河南实验二中重点班是竞赛班。河南省第二实验中学创建于1998年,是河南省教

    2026年03月06日
    6319
  • 甘旗卡站的车站概况

    网上有关“甘旗卡站的车站概况”话题很是火热,小编也是针对甘旗卡站的车站概况寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。车站名称:甘旗卡站邮政编码:028100前后方车站:在大郑线上行方向距离大虎山站180公里,下行方向距离郑家屯站190公里。隶属单位:沈阳

    2026年03月07日
    4300
  • 期房全款发票交房才给吗

    网上有关“期房全款发票交房才给吗”话题很是火热,小编也是针对期房全款发票交房才给吗寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。全款发票一般是在交房时才会给。期房出售时给的收款凭证叫合同发票,通常出现于房屋买卖预售中。当业主选中未建成但预售的房屋后,与开发商

    2026年03月07日
    4303
  • 邓州高铁的详细内容

    网上有关“邓州高铁的详细内容”话题很是火热,小编也是针对邓州高铁的详细内容寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1月27日,新华社报道了全国多地围绕高铁走线、设站而展开的“争路运动”。报道列举了多地采取“舆论战”、官方公关、“群众施压”的现象,称“争

    2026年03月07日
    5306
  • 国家对工业园区及招商引资有什么优惠政策?

    网上有关“国家对工业园区及招商引资有什么优惠政策?”话题很是火热,小编也是针对国家对工业园区及招商引资有什么优惠政策?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一、企业准入政策第一条除国家法律、法规明令禁止外,只要符合国家产业政策的企业和项目均可入驻园

    2026年03月07日
    0313

发表回复

本站作者才能评论

评论列表(3条)

  • 一条小晨萱的头像
    一条小晨萱 2026年03月07日

    我是天七号的签约作者“一条小晨萱”

  • 一条小晨萱
    一条小晨萱 2026年03月07日

    本文概览:网上有关“【代谢组学】代谢组学与其他组学数据的整合”话题很是火热,小编也是针对【代谢组学】代谢组学与其他组学数据的整合寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在...

  • 一条小晨萱
    用户030710 2026年03月07日

    文章不错《【代谢组学】代谢组学与其他组学数据的整合》内容很有帮助