常见问题
传统单一层面的组学研究,如基因组、转录组、蛋白组以及代谢组等研究手段,能够在 一定程度上对特揭示遗传信息、蛋白功能或代谢通路进行阐释。但是,仅通过单一组学数据 很难对复杂的生物网络调控进行系统全面的解释,且不足以解释遗传信息表达调控的传递链 条。因此,多组学数据整合成为了系统生物学研究的发展趋势,其优势如下:
(1)更准确——弥补单一组学分析时,由于数据噪音、缺失等因素带来的数据问题。
(2)更可靠——多组学数据资源之间可以进行相互验证,减少单一组学分析带来的假 阳性。
(3)更深入——多组学数据联合分析更有利于从不同层面、不同角度,系统解析生物 学模型的多层次机制或机制表型的联系。 转录组
与蛋白质组联合分析的意义主要体现在以下两方面:
(1)RNA 和蛋白质对于基因表达的表征情况不一致,可形成有效互补。由于各种转录 后调控机制(如 miRNA,蛋白质泛素化系统等)的存在,生物体内 RNA 与蛋白质的表达 相关性往往并不高(相关性系数大约平均在 0.6 左右)。生命活动的功能执行者是蛋白质, 因此蛋白质的表达水平更能真实反应最终的生物表型变化。然而,由于质谱仪器灵敏度受限、 蛋白质分子无法扩增等因素,蛋白质组学的检测数据量相对转录组学较低。尤其针对一些低 丰度表达的重要功能蛋白(如转录调控因子等),蛋白质组学可以获得的信息相对有限。因 此,转录组和蛋白质组各自具有技术优势,转录灵敏度高、蛋白更贴近表型,两个组学的联 合可以实现优势互补,获得更完整有效的信息。
(2)物种研究更深入。针对非模式物种,蛋白质组数据库往往不够完善,从而导致蛋白组分析注释受到较大限制。通过无参转录组的转录本拼接注释,可以为蛋白质组学提供数据 库信息,极大程度地提高数据注释度。针对模式物种以及其它有蛋白数据库的物种,转录组 测序分析得到的新转录本、可变剪切、碱基突变插入缺失(SNP/InDel)等信息可以使蛋白 数据库更完整,从而增加蛋白质组学分析的覆盖度和精确度。
转录/蛋白质组与代谢组联合分析的意义:
转录组和蛋白质组都是用来反应基因的表达差异情况。然而,在实际研究中经常会存在 这样的困扰:差异比较分析后获得的许多基因和蛋白,其功能看似与表型差异没有直接的联 系。这种情况下,无论是对组学数据的讨论,或是选定某些关键基因深入研究其分子功能机 制都是一个不小的难题。
因此,转录/蛋白质组与代谢组联合分析的意义也体现在两方面:
(1)对于一些热门研究领域,已经有非常多的报导显示表型与一些关键代谢物有直接 关联。如肿瘤与能量代谢、植物抗逆与植物激素、消化道疾病与胆汁酸、短链脂肪酸等等。 无论是通过已知的基因-代谢物的关联数据库(如常用的 KEGG),或是通过基因表达与代谢 物浓度的统计关联,都可以帮助找出代谢物背后与它紧密相关的基因或蛋白质,实现差异表 型与关键基因/蛋白的信息关联,为进一步收敛聚焦关键分子机制提供更可靠的信息。
(2)针对新兴研究领域,转录/蛋白质组与代谢组的联合可以提供一幅更全景式的分子 关联网络。在诸多的差异组学分子中,通过挑选其中有相互关联的功能或通路进行重点讨论 和研究,为该领域的拓荒提供更有指导性的方向,最终实现对生物变化大趋势与方向的综合 了解。