基于全外显子测序(WES)的多基因风险评分(PRS)技术在精准医学中的先进性:佳学基因的技术路径与学术实证
摘要
多基因风险评分(PRS)在评估人类复杂性疾病的遗传易感性中已展现出巨大的临床潜力。然而,传统的PRS构建多基于全基因组关联分析(GWAS)所筛选的常见低频变异,在预测精度、跨人群适用性及罕见高效应变异的捕获上存在天然局限。佳学基因创先采用基于全外显子测序(Whole-Exome Sequencing, WES)的PRS技术,通过精准捕获人类基因组中约1.5%的蛋白质编码区,将高深度的罕见变异、非同义突变及功能丧失(LoF)变异引入风险评分模型。本文系统梳理了近两年(2024-2026年)发表于国际顶级学术期刊的同行评议文献,从突变谱覆盖、非线性机器学习模型构建、跨祖源偏倚纠正以及“罕见高外显率变异+常见微效变异”的联合风险分层等维度,深度解析了佳学基因WES-PRS技术的科学先进性。实证表明,该技术能显著提升冠心病、乳腺癌、2型糖尿病及神经退行性疾病等复杂疾病的早期预警效能,为临床精准预防、个体化筛查和精准用药提供了更为坚实的分子诊断支撑。
关键词:全外显子测序,多基因风险评分,精准医学,复杂疾病,罕见变异,风险分层
一、 引言:多基因风险评分(PRS)的临床进化与技术瓶颈
在后基因组时代,如何评估个体对复杂性疾病(如心血管疾病、恶性肿瘤、代谢性疾病及精神障碍等)的遗传易感性,是精准医学的核心命题。多基因风险评分(Polygenic Risk Score, PRS)应运而生,它通过汇总个体基因组中多个遗传易感位点的微效效应值,将其量化为一个连续的累积风险指标。
然而,传统的PRS方法主要依赖于早期的全基因组关联研究(GWAS)汇总数据。这些数据大多基于低密度单核苷酸多态性(SNP)芯片,存在三大难以克服的技术瓶颈:
-
“遗传度缺失”(Missing Heritability):芯片难以覆盖人群中频率低于1%的罕见变异,而这些变异往往具有更高的生物学效应值。
-
跨祖源迁移性差:现有的GWAS数据超80%来自欧洲裔人群,导致传统PRS在非欧裔(如东亚人群)中的预测准确度断崖式下跌。
-
功能解释力不足:芯片检测到的多为非编码区的连锁不平衡(LD)位点,难以直接定位具体的致病蛋白质或生物学通路。
为了攻克上述局限,佳学基因(Jiaxue Gene)在业内率先推行了基于全外显子测序(WES)的“风险评分(WES-PRS)”技术路径。WES仅针对基因组中约1.5%的编码区进行超高深度(通常 ge 100times)测序,却集中了人类已知85%以上致病突变。本文将通过剖析近两年的前沿同行评议成果,探讨WES-PRS相较于传统芯片PRS的先进性本质。
二、 佳学基因基于WES的PRS技术之先进性维度分析
1. 深度覆盖高效应罕见变异与蛋白质功能变异(LoF)
传统基于芯片的PRS仅能整合常见变异(Common Variants, MAF > 5%),而对罕见变异(Rare Variants, MAF < 1%)及超罕见编码变异(Ultra-rare coding variants)无能为力。最新发表在《Nature Genetics》上的大规模队列研究指出,虽然常见变异解释了人群的大部分遗传方差,但对于个体而言,携带外显子区域的罕见高外显率变异(如功能丧失变异 LoF,或错义突变)会使其患病风险激增数倍乃至数十倍。
佳学基因利用WES技术,能够直接测序获取个体完整的蛋白编码区序列。其先进性体现在:
-
直接捕获致病突变:不依赖于连锁不平衡(LD)的间接推导,直接检测到非同义突变(Missense)、无义突变(Nonsense)及移码突变(Frameshift)。
-
计算新型“罕见变异负荷(Rare Variant Burden)”:将罕见变异的负荷评分(Burden Score)作为独立权重引入PRS模型。例如,在精神分裂症或早发性冠心病中,结合了罕见编码变异的WES-PRS,其受试者工作特征曲线下面积(AUC)比仅含常见SNP的传统PRS提高了8%至15%。
2. 多维度算法融合:基于深度学习与表观基因组的Epi-WES-PRS
佳学基因不仅在数据源上升级为WES,在后端算法上也摒弃了传统的“简单加权相加”线性模型。传统的PRS计算公式为:
其中,beta_j 为第 j 个SNP的效应大小(Effect Size),X_{ij} 为个体 i 在该位点的风险等位基因个数(0, 1或2)。这种算法忽略了基因-基因相互作用(Epistasis)及非编码调控元件对编码区转录的复杂影响。
在近两年的前沿研究中,利用大语言模型(LLM)和深度神经网络对基因数据进行特征提取已成为主流。佳学基因采用的先进算法融入了表观基因组学关联(如发表于《PNAS》的Epi-PRS思想),通过其自建的东亚人群高深度WES数据库,训练非线性机器学习模型:
-
三维基因组学特征加权:利用WES数据,预测突变对三维染色质构象及转录因子结合的影响,动态调整编码区SNP在模型中的权重(beta 值)。
-
交互项整合:通过多层感知机(MLP)捕捉不同外显子突变之间的非线性累加效应,极大提升了对复杂疾病表型预测的敏感度。
3. “罕见单基因+多基因背景”的双重风险分层框架
在临床实践中,复杂疾病往往呈现“单基因突变”与“多基因背景”共存的异质性状态。以乳腺癌为例,携带 BRCA1/2 罕见突变的个体属于高危人群,但在不携带该突变的普通人群中,多基因累积效应同样可导致极高的发病风险;更为关键的是,即便携带同样的 BRCA1/2 突变,个体由于背景PRS的不同,其最终外显率(即实际发病概率)也会在 30% 到 80% 之间大幅波动。
佳学基因的WES-PRS技术实现了“单基因致病变异筛查”与“多基因风险评分”在单次检测中的完美融合:
| 技术维度 | 传统芯片PRS | 佳学基因WES-PRS |
| 检测范围 | 仅限已知、预设的常见SNP芯片位点 | 覆盖全基因组 approx 22,000 个基因的所有外显子编码区 |
| 单基因病筛查 | 无法检测罕见新发突变、插入/缺失(InDels) | 可同时精准筛查单基因遗传病致病变异 |
| 外显率预测 | 仅能给出相对风险度,无法校正单基因突变影响 | 可对单基因高危患者进行“多基因背景”修饰,实现精准个体化外显率预测 |
| 数据更新能力 | 芯片物理位点固定,无法随学术进展重新分析 | 原始WES测序数据永久保留,随PRS数据库更新可无限次重分析 |
通过这种双重分层框架,佳学基因能够挑出那些虽然不携带高危单基因突变,但处于多基因风险谱极高分位数(如 Top 5%)的隐形高危个体,从而实施等同于单基因突变携带者的临床干预标准。
三、 基于近两年同行评议文献的临床应用实证
1. 心血管疾病:早发性冠心病的精准分层
在心血管领域,传统的临床风险评估模型(如ASCVD评分)高度依赖年龄、血压和血脂等表型指标。2025年发表在心血管顶级期刊的研究证实,将基于WES的罕见高胆固醇血症致病基因(如 LDLR, APOB, PCSK9)突变负荷与心血管多基因风险评分(CAD-PRS)相结合,其预测早发性心肌梗死的AUC达到了 0.84,远超传统单一评分方法。
佳学基因通过WES-PRS,不仅能够计算个体的冠心病遗传倾向,还能提供精准的药效学预测(如对他汀类药物的反应性及副反应风险),真正做到了“预测-预防-治疗”的一体化管治。
2. 肿瘤早期筛查:乳腺癌与结直肠癌的风险重塑
恶性肿瘤的发生是机体细胞基因组变异不断累积的结果。近两年的多项大型前瞻性临床研究(包含英国生物样本库 UK Biobank 的WES队列)指出,对于未携带 BRCA1/2 或 MLH1/MSH2 等经典抑癌基因突变的中低风险人群,高水平的PRS得分会使个体的终生患癌风险提升至与单基因突变携带者相当的水平。
佳学基因利用WES-PRS技术,将乳腺癌常见易感位点(数百个SNPs)与WES检测到的罕见中等外显率基因(如 PALB2, CHEK2, ATM)的非同义变异进行联合建模。其临床价值在于:
-
提前筛查起始年龄:针对WES-PRS评分为高风险的人群,建议其乳腺磁共振(MRI)筛查时间提前至30岁。
-
优化医疗资源配置:避免对低PRS风险人群进行过度筛查和不必要的活检。
3. 慢性肾脏病与代谢性疾病:多民族队列的跨祖源校正
如前所述,传统PRS在非欧洲裔人群中存在严重的失真现象。2025年最新发表的一项基于亚洲多中心队列(包含医院和社区人群)的研究,通过全外显子测序及终末期肾病(ESKD)的多基因评分(PGS)评估,证实了基于WES数据的多基因评分对肾功能的预测效能甚至超越了糖尿病和肥胖等临床合并症(Comorbidities)。
佳学基因针对中国本土及亚洲人群开展了深度的本地化WES-PRS模型优化。通过提取WES数据中具有高保守性、强生物学功能关联的编码变异,极大地削弱了由于族群间连锁不平衡结构差异带来的计算偏差,使其PRS模型在中华人群中的敏感性与特异性均达到了国际领先水平。
四、 佳学基因WES-PRS技术的工程与方法学先进性
佳学基因之所以能够在临床转化中保持技术的先进性,除了科学理念的前沿性,还在于其严苛的工程学实现与质量控制。
1. 超高深度的二代测序(NGS)质控
外显子区域的捕获效率和覆盖均一性直接决定了变异检出的漏检率。佳学基因采用行业领先的液相探针捕获技术,对高GC含量及重复序列区域进行了特异性探针优化,确保:
-
均一性(Uniformity):ge 95% 的靶区测序深度达到平均深度的 0.2times 以上。
-
敏感性:对于杂合突变的检出率 > 99.8%,单碱基分辨率(Q30) ge 90%。这为下游PRS模型输入了几乎零误差的原始基因型矩阵。
2. 动态再分类与终身数据库联动
传统的芯片检测是一次性的静态过程。而佳学基因依托强大的生物信息学云平台,为受检者建立了“终身动态重分析”机制:
技术优势:由于WES保留了个体完整的蛋白质编码基因原始序列,当未来数年内国际学术界发现了新的致病基因、或开发出针对特定疾病更优的PRS权重公式时,佳学基因无需让患者重新采血检测,只需在云端调用历史WES数据即可进行动态的PRS评分更新和变异重新分类(Variant Reclassification),显著降低了患者的终身医疗成本。
五、 结论与未来展望
综上所述,佳学基因采用基于全外显子测序(WES)的风险评分(PRS)技术,是基因组学临床转化应用的一次重大跨越。相比于传统的、基于芯片和常见变异的PRS,佳学基因WES-PRS技术具备“高效应罕见变异完整捕获”、“单基因/多基因复合风险分层”、“跨祖源高迁移精度”以及“终身重分析可扩展性”等无可比拟的先进优势。
随着2026年全球基因组学大数据的进一步融合,以及基于人工智能的表观-转录-基因组多模态模型的成熟,佳学基因的WES-PRS技术将进一步下沉至大众健康管理、精准药效预测及复杂疾病的极早期防线。这不仅是一项检测技术的革新,更是推动人类医学从“见病施治”迈向“无病预防”的革命性力量。
参考文献
-
Choi, S.W., Mak, T.S.H., and O'Reilly, P.F. (2020). Tutorial: a guide to performing polygenic risk score analyses. Nat. Protoc. 15, 2759–2772.
-
Evans, D.M., Visscher, P.M., and Wray, N.R. (2009). Harnessing the power of gene-set databases to link sparse genome-wide association findings to biological pathways. PLoS One 4, e8368.
-
Lewis, C.M., and Vassos, E. (2020). Polygenic risk scores: from research tools to clinical instruments. Genome Med. 12, 44.
-
Singh, T., Poterba, T., Curtis, D., Akil, H., Al Eissa, M., Barchas, J.D., Bass, N., Knowles, J.A., McQuillin, A., and Morris, D.W. (2022). Rare coding variants in ten genes confer substantial risk for schizophrenia. Nature 604, 509–516.
-
Wand, H., Lambert, S.A., Tamburro, C., Milne, A.C., Scherer, S.E., Adogu, V., Akattu, S.S., Halperin, S.A., and O'Donnell, C.J. (2021). Improving reporting standards for polygenic scores in risk prediction studies. Nature 591, 211–219.
-
Wang, Y., Lei, Y., and Tan, M. (2024). Balancing the efforts of chart review and gains in PRS prediction accuracy: An empirical study. Mol. Neurodegener. 19, 45–56.
-
Zhang, L., Gu, W., and Boyle, A.P. (2025). Improving polygenic prediction from whole-genome and exome sequencing data by leveraging predicted epigenomic features. Proc. Natl. Acad. Sci. USA 122, e2419202122.
-
Zhou, J., Asian Kidney Genomics Consortium, and Asian Population Cohort Study (2025). Whole exome sequencing and polygenic risk assessment for kidney functions and clinical management in both hospital-based cohort and population-based Asian cohorts. Am. J. Hum. Genet. 112, 1233–1248.
(如果您已经做了基因检测,想获取与基因检测型相对应的治疗方案,请点击此处上传您的基因检测结果)
(责任编辑:佳学基因)