文献解读|Nat Genet(31.7):代谢组学与外显子组测序相结合揭示了罕见的破坏性杂合变异对基因功能和人类特征的分级影响
✦ +
+
论文ID
原名:Coupling metabolomics and exome sequencing reveals graded effects of rare damaging heterozygous variants on gene function and human traits
译名:代谢组学与外显子组测序相结合揭示了罕见的破坏性杂合变异对基因功能和人类特征的分级影响
期刊:Nature Genetics
影响因子:31.7
发表时间:2025.01.02
DOI号:10.1038/s41588-024-01965-7
背 景
数千种酶和转运蛋白通过复杂的相互作用维持代谢中间体和终产物的生理水平。这些蛋白的功能紊乱会导致严重疾病,例如由先天性代谢障碍 (IEM) 引起的疾病,或使人易患 2 型糖尿病或痛风等常见代谢疾病。在大群体中开展的全基因组关联研究 (GWAS) 发现了数千种与代谢物水平改变相关的常见遗传变异,但这些变异的功能效应通常未知,而且其适度的效应大小限制了它们对临床的直接影响。以前,这类研究几乎只集中在循环代谢组上。但最近研究表明,配对的血浆和尿液代谢组的 GWAS 不仅可以揭示更多的关联,而且还可以提供对肾脏代谢物处理的具体见解。因此,本研究旨在使用全外显子组测序 (WES) 数据对德国慢性肾脏病 (GCKD) 研究中 4737 名参与者的 1294 种血浆和 1396 种尿液代谢物水平的总体影响进行基因分析,以鉴定与代谢相关的基因,并了解潜在的罕见的、几乎完全是杂合的变异是否允许与从 IEM 研究中获得的推论互补的推论。
实验设计

结 果
01
发现 192 个重要的基因-代谢物关联
基于来自 4737 名 GCKD 研究参与者(平均年龄 60 岁,40% 为女性)的全外显子组测序 (WES)数据,在 16525 个基因中鉴定出罕见的、推定有害的变异。代谢物由非靶向质谱法测定,涵盖多种通路。使用两个互补的“掩码”进行WES数据,以检测每个基因与 1294 种血浆和 1396 种尿液代谢物(781 种重叠)中每种代谢物水平之间的关联,两个“掩码”在选择基于基因的符合条件的变异(QV)方面有所不同。虽然 'LoF_mis' 掩码包含每个基因中位数为 8 个 QV,预测为高置信度功能丧失 (LoF) 变体以及有害错义和同构非同义变体,但 'HI_mis' 掩码包含每个基因中位数为 16 个 QV,预测为高影响后果(转录本消融或扩增、剪接受体或供体、终止密码子获得、移码、起始或终止缺失)以及使用额外预测分数预测为有害错义变体。这两个掩码都假设了 LoF 机制,但解释了不同的遗传结构(图1)。
他们在血浆和尿液中鉴定了 192 个显著的基因-代谢物对,其中在两者中均检测到了 43 个关联(图2a)。这些涉及 73 个独特基因和 179 种代谢物,在血浆和尿液中鉴定的基因和代谢物数量相当。在血浆和尿液中分别有 22 个和 17 个基因具有显著关联。虽然使用两个掩码都检测到了大多数关联,但更具包容性的“HI_mis”掩码比“LoF_mis”掩码产生了更多的掩码特定关联(图2b)。氨基酸和脂质是相关代谢物中的主要途径。血浆中相关脂质的比例高于尿液中相关脂质的比例,这与许多脂质缺乏肾小球滤过相一致(图2b)。在血浆和尿液中检测到的关联通常会以相同的方向影响相关代谢物的水平(图2a)。敏感性分析评估了聚集检验的附加掩模和方法[仅 LoF、序列核关联检验 (SKAT) 和 SKAT-最优统一检验 (SKAT-O)]以及性别分层和肾功能分层分析。
先前使用类似技术获得的基于测序的稀有变异与代谢物水平之间的关联的独立研究主要集中在血浆和血清。将本研究中发现的 128 个基因-血浆代谢物关联与之前的研究进行比较,结果表明,69%(128个中的88 个)以前没有报道过,但是93%(88 个中的 82 个)的新发现涉及之前分析过的代谢物。73 个独特的代谢物相关基因在已知的导致 IEM 的基因中占有较高的比例,其中 28 个(38%)目前已知含有致病突变。在他们对中老年人的研究中检测到的 QV 几乎完全是在杂合状态下观察到的。两个掩码中的 QV 详细注释显示,15 个基因中的 63 个独特 QV 和 17 个基因中的 73 个独特 QV 在 ClinVar 中列为相应单基因疾病的“致病”或“致病或可能致病”。这些观察结果支持了这样的观点:基于基因的稀有、杂合、假定有害变异的聚集可以有效地鉴定与人类疾病有关的基因-代谢物关系。

图1. 研究设计概述。

图2. 血浆和尿液中已鉴定的 192 个基因-代谢物关联及其相应途径的概述。
(a) 最外层带显示与血浆代谢物的显著关联(红色;阴影反映效应方向),基因按基因组中的染色体位置排序。中间带显示与尿液代谢物的关联(蓝色;阴影反映效应方向)。(b) UpSet 图显示通过掩码和矩阵识别出的基因-代谢物关联的数量,并按相应的代谢物超通路进行颜色编码。右侧水平条形图表示通过掩码和矩阵识别出的关联的总数。
02
通过独立、互补的方法进行验证
他们使用四种互补的方法来验证研究结果:首先,大型英国生物库 (UKB) 允许使用相同的分析选择分析相同的QV,就像对两种重叠代谢物的研究一样,并且显示出基因-代谢物关联的效应大小非常相似(图3a)。其次,UKB 蛋白质组学数据26包含有关研究中涉及的 17 个基因的编码蛋白质循环水平的信息。汇总蛋白质截短和罕见损伤变异的负荷检验揭示了其中 15 种蛋白质的水平较低(图3b),这可能是由无义介导的衰变解释。第三,将本研究结果与先前对血浆代谢组的研究结果进行比较,结果表明,无论是在变异水平还是在聚合水平,效应大小都与本研究结果高度相关(图3c-d)。

图3. 使用正交方法对研究结果进行独立验证。
(a) 使用相同的掩码并且仅包括 GCKD 研究和 UKB 中可用的 QV,在 ≥261661 名 UKB 参与者中对显著相关的可用血浆代谢物进行基于基因的检测(y轴),在两项研究中提供非常相似的效应大小(x轴)。条形图表示相应的标准误差 (SE) 。(b) 在 UKB 中测量了 73 个显著代谢物相关基因中的 17 个编码的蛋白质的血浆水平。(c) GCKD 研究中给定血浆代谢物水平的单变量效应大小。(d) 128 个血浆基因-代谢物关联中的 89 个的汇总统计数据。
03
蛋氨酸砜是体外直接的 SLC6A19 底物
他们对所涉及的基因-代谢物关系进行了概念验证实验验证研究。由SLC6A19编码的B0 AT1 转运蛋白负责跨肠道和肾脏上皮细胞顶端膜吸收中性氨基酸。除了与已知底物天冬酰胺、组氨酸和色氨酸水平相关之外,他们还检测到与蛋氨酸砜(methionine sulfone)的关联,蛋氨酸砜尚未作为底物报道。与对照相比,过表达人类 SLC6A19 及其辅分子伴侣 collectrin (CLTRN) 的 CHO 细胞中的运输研究确实证实了蛋氨酸砜是体外转运蛋白的底物,其浓度范围与其已知底物异亮氨酸相似(图4a)。特异性表现为使用 SLC6A19 抑制剂 cinromide 后运输活性完全受到抑制(图4b)。总之,这四条互补的证据都支持检测到的关联的有效性。

图4. 蛋氨酸砜是体外直接的 SLC6A19 底物。
(a) 过表达 SLC6A19 的 CHO 细胞 (SLC6A19 细胞) 及其伴侣 CLTRN 与模拟细胞中L-异亮氨酸和蛋氨酸砜的转运。通过膜电位染料的荧光增加来测量底物转运活性。(b) 桂利胺对过表达 SLC6A19 和 CLTRN 的细胞中 L-异亮氨酸和蛋氨酸砜转运的影响。
04
X 染色体基因分析
X 染色体(非假常染色体)区域的基因为研究杂合女性和实际纯合(即半合)男性之间的差异提供了机会。因此,他们研究了筛选中确定的两个 X 染色体基因TMLHE和RGN的性别差异。
事实上, TMLHE中 QV 的男性携带者的尿液中N6、N6、N6 -三甲基赖氨酸(编码酶三甲基赖氨酸双加氧酶的底物)的水平明显高于女性携带者,而其产物羟基- N6、N6、N6 -三甲基赖氨酸的水平也明显较低,尤其是在关注驱动变体时(图5)。在血浆中,男性 QV 携带者的血浆羟基- N6、N6、N6 -三甲基赖氨酸水平比非携带者低 1.15 sd,而女性 QV 携带者的代谢物水平仅比非携带者低 0.45 sd。在RGN和未命名代谢物 X-23436 的尿液水平中也观察到了类似的趋势。男性和女性携带者的水平都较高,这表明 X-23436 是编码的 regucalcin 催化反应上游的代谢物。GTEx 项目的数据显示,组织间基因表达没有性别差异。因此,代谢物水平的性别差异效应可能代表了所涉及 QV 的杂合性与半合性导致的剂量反应效应。

图5. X 染色体TMLHE中 QV 的男性和女性携带者尿液代谢物水平的差异反映了剂量反应效应。
05
个性化 WBM 捕捉观察到的代谢变化
他们使用综合聚类描绘了 NMIBC 的生物学框架,以研究多组学数据的整合是否提供了超出肿瘤单层分层的额外生物学和预后价值。对于 230 个具有重叠数据层的肿瘤,他们对体细胞突变、CNA 和基因表达数据进行了联合聚类,并确定了四个“iCluster”,标记为 iClus1-4(图5a)。iCluster 与 UROMOL2021 类和 WGD 状态重叠。iClus4 包括 UROMOL2021 2a 类和 2b 类肿瘤的混合,包括所有 2a 类肿瘤的 70% (26/37) 和所有 2b 类肿瘤的 38% (29/77),以及 93% (26/28) 的 WGD 肿瘤(图5a)。因此,iCluster 与 PFS 相关(图5b),其中 iClus4 肿瘤具有最高的进展风险,与肿瘤分期和 UROMOL2021 分类无关。 iClus4 肿瘤具有更高的 2a 类加权计算机病理学(WISP)权重,TMB 更高并且基因组更不稳定,仅评估二倍体肿瘤时也是如此(图5c)。
在 iClus2 和 iClus4 中观察到更高的基于 RNA 的免疫浸润评分。一致的是,当对肿瘤 WES 数据使用工具 TcellExTRECT时,在 iClus2 和 iClus4 中观察到更高的 T 细胞相对分数。他们没有观察到 iClus2 和 iClus4 之间 CD4 T 细胞和 CTL的基于 RNA 的评分差异 ;然而,与 WGD 肿瘤的分析类似,与 iClus2 中的肿瘤相比,iClus4 内的肿瘤显示出更高的肥大细胞和中性粒细胞评分(图5d)。鉴于iClus4中髓系细胞的富集以及在iClus4中观察到的患者预后不良,他们假设iClus4的特点是免疫景观功能失调,与适应性抗肿瘤活性相比,先天活性更多。为了评估这一点,他们研究了适应性与先天免疫比率,发现iClus4与iClus2相比得分较低,表明iClus4肿瘤具有更高的先天成分。此外,他们观察到iClus4中T细胞耗竭较高(图5d),ERAP1和ERAP2表达较低(图5e-f),表明T细胞耗竭和肽呈递受损可能是肿瘤侵袭性和不良预后的主要驱动因素。值得注意的是,iCluster和进展均与外周血中较低水平的 T 细胞或低 T 细胞受体 (TCR) 多样性无关,表明这些患者的免疫健康状态总体相似。

图6. 改变的代谢物水平是KYNU和PAH功能受损的读数。
(a-b) 三幅图分别表示与KYNU相关的 8-甲氧基犬尿酸水平和与PAH相关的苯丙氨酸水平。
06
代谢物代表人类特征的中间读数
等位基因系列描述了一种剂量反应关系,其中基因中越来越有害的突变会对性状或疾病产生越来越大的影响。他们假设,如果代谢物代表潜在(病理)生理过程的分子读数,那么遗传对代谢物水平的影响应该表现为等位基因系列。作为原理证明,他们研究了血浆硫酸盐,因为有确凿的证据证明基因-代谢物之间存在因果关系:首先,SLC13A1中的 QV对较低的血浆硫酸盐水平显示出显著的总体效应。观察到的关联得到了实验研究的充分支持,这些研究确定编码的 Na +-硫酸盐共转运蛋白 NaS1(SLC13A1)在肾小管上皮细胞的顶端膜上重新吸收过滤的硫酸盐。其次,之前已通过实验证实,SLC26A1中与血浆硫酸盐相关的 QV是导致硫酸盐转运减少的 LoF 等位基因,这与SLC26A1中驱动变异的总体效应一致,与血浆硫酸盐相关的 P值为2 × 10 −11。编码的硫酸盐转运蛋白 SAT1 定位于管状上皮细胞的基底侧膜,与 NaS1 串联作用,介导跨细胞硫酸盐重吸收(图7a)。
基于Slc13a1 基因敲除小鼠的生长迟缓表型以及SLC13A1与 UKB 较低坐高之间的关联,他们研究了SLC13A1和SLC26A1中的六个功能性驱动 QV与 UKB 人体测量值的关系。GCKD 研究中血浆硫酸盐水平的遗传效应大小以及 UKB 的坐高和站高是相关的(图7b)。这些观察结果支持跨细胞硫酸盐重吸收与人类身高之间的因果关系,并将血浆硫酸盐指定为中间读数。此外,他们观察到SLC13A1和SLC26A1驱动变异携带者的站立身高明显低于GCKD 研究中已测量身高的非携带者。SLC13A1 中驱动变异的总体效应大小为 -0.54)。对于SLC26A1,他们鉴定出了更强的效应大小(-0.73)。
SLC13A1和SLC26A1中罕见的 LoF 变异已通过 IEM 和 GWAS 与个体肌肉骨骼表型相关联。他们进一步研究了 SLC13A1 和 SLC26A1中相同的六个功能性硫酸盐相关 QVs 与 UKB 中的肌肉骨骼疾病、骨折和损伤之间的关联,其中至少有两名携带者,有疾病和无疾病。有 116 个与临床特征和疾病的名义显著关联,其中 113 个与疾病几率增加有关(图7c)。例如,各种骨折的几率高达 30.7。尽管增加的几率支持硫酸盐转运蛋白中的 LoF 变体与多种肌肉骨骼疾病易感性之间的关系,但由于 QV 和许多疾病都很罕见,因此检测几率降低的能力有限。
携带六个 QV 中任何一个的多个副本的 UKB 参与者接受了更仔细的调查。在 GCKD 研究中,在九名杂合携带者中观察到导致 NaS1 中 p.Arg272Cys 替换的稀有等位基因,由于其位于剪接区、对血浆硫酸盐水平影响大以及对人类身高的影响特别大,因此优先考虑(图7b)。在 UKB,他们发现了 294 名 p.Arg272Cys 杂合携带者,其中四人同时携带 NaS1 中的 p.Arg272Cys 和 SAT1 中的 p.Leu348Pro,一人为 p.Arg272Cys 纯合子。人类身高的年龄和性别特异性z分数显示出明显的剂量反应效应(图8a)。与 p.Arg272Cys 杂合携带者相比,四个跨细胞硫酸盐重吸收蛋白中 LoF 变异杂合的个体之间影响更强,这仅支持了人类生长途径中的附加效应。NaS1 p.Arg272Cys 携带者与多种肌肉骨骼疾病(如背痛、椎间盘疾病以及骨折)的患病几率增加有关(图8b)。他们还发现了 NaS1 p.Arg12* 和 SAT1 p.Leu348Pro 纯合子,结果相似。总之,这些结果有力地支持了以下观点:代理较低跨细胞硫酸盐重吸收的遗传变异与人类身高和多种肌肉骨骼特征和疾病有关。因此,优先考虑等位基因系列中具有强烈影响的变异,以便在更大规模的研究中进行后续研究,即使生物标志物关联仅依赖于少数杂合等位基因,也可以成为了解罕见破坏性变异对人类健康影响的有效策略。

图7. SLC13A1和SLC26A1中的功能性 QV对身高、肌肉骨骼特征和骨折的影响支持血浆硫酸盐作为中间读数的作用。
(a) 涉及上皮细胞顶膜上由SLC13A1编码的 NaS1 和基底外侧膜上由SLC26A1编码的SAT1的硫酸盐重吸收机制示意图。(b) 散点图显示了六种 QV 对 GCKD 研究中血浆硫酸盐水平(x轴)和 UKB(N ≥ 466907)中站立高度(y轴)的效应大小之间的关系。(c) 火山图显示 基于 Firth 回归,六种 QV 与 UKB(N ≥ 468279)中的肌肉骨骼疾病和骨折关联的优势比。

图8. 编码 NaS1 p.Arg272Cys 替换的不同基因型对身高和肌肉骨骼特征及骨折的影响。
(a) 箱线图显示了p.Arg272Cys 编码等位基因杂合和纯合的 UKB 参与者中年龄和性别特定的站立高度z分数的差异。(b) NaS1 p.Arg272Cys 取代与来自 UKB 的肌肉骨骼疾病和骨折之间的关联。
+ + + + + + + + + + +
结 论
本研究使用基于全外显子组测序数据的稀有变异聚集测试来检测与 1294 种血浆和 1396 种尿液代谢物水平相关的基因,他们发现了 235 种基因-代谢物关联,其中许多是以前未报告过的。互补方法[遗传学、在人类代谢的全身模型中进行计算机基因敲除和一项实验原理证明]提供了正交证据,表明对杂合状态下的稀有、有害变异的研究可以得出与先天性代谢错误一致的推论。负责跨细胞硫酸盐重吸收的转运蛋白(SLC13A1、SLC26A1)中的一系列功能性变异对血浆硫酸盐和人类身高表现出分级影响,并确定了与人群中各种肌肉骨骼特征和疾病几率增加相关的等位基因。这种综合方法可以识别未完全表征的人类代谢反应中的新参与者,并揭示有关人类特征和疾病的代谢读数
+ + + + +



English

