上周我们新推出了血浆/血清蛋白质组学的业务,今天作为癸卯年最后一篇文章,我们继续来看几个具体的的案例,讲讲这个技术在实际研究中的应用。
案例1
2023年11月,Mohsen M等人在Journal of the American College of Cardiology期刊上(IF=24.0)发表了题为“Plasma Proteomics to Identify Drug Targets for Ischemic Heart Disease”的文章。该研究基于血浆蛋白质组技术,结合遗传数据库的综合分析阐明了蛋白质的因果相关性,并发现了缺血性心脏病(IHD)和其他疾病的药物新靶标。
研究背景
缺血性心脏病(IHD)每年导致全球约900万人死亡,并且在包括中国在内的许多人群中,其发病率逐渐上升。吸烟、高血压、血脂异常和肥胖是IHD的既定危险因素,但其他危险因素仍有待发现。最近,主要欧洲血统人群中IHD的全基因组关联研究(GWAS)已识别出超过240种常见遗传变异,但其中许多关联的潜在机制仍有待阐明。大多数药物靶点是酶、转运蛋白或结构蛋白,测量血浆中大量蛋白质水平的新方法(特别是与遗传数据整合时)可以发现IHD的新风险因素和潜在治疗靶点,并改善风险预测和早期诊断。
本研究的目的是在人群研究中检查蛋白质组学和遗传学数据与IHD的关联,以发现新的预防治疗方法。
研究思路
(1)样品收集:来源于中国慢性病前瞻性研究(China Kadoorie Biobank,CKB)生物样本库,涉及1971例IHD病例和2001名经过基因分型且既往无心血管疾病的子队列参与者;
(2)采用血浆蛋白质组学和遗传数据综合分析,鉴定与IHD风险相关的蛋白质;
(3)基于CKB和UKB数据库,鉴定顺式蛋白质定量位点(pQTL);
(4)孟德尔随机化(MR)分析评估pQTL与IHD的因果相关性;
(5)使用富集分析、组织表达和单基因敲除(KO)模型探索此类蛋白质与IHD的联系机制。
图1 血浆蛋白质组学识别缺血性心脏病的新药物靶点流程图(Mohsen M et al., 2023)。
研究结果
对中国和欧洲成年人的蛋白质组和遗传数据进行综合分析,总共有361个蛋白质在CKB中以<0.05的错误发现率与IHD风险显著相关(349个正向,12个反向),包括
NT-proBNP和PCSK9。
在这361个蛋白中,212个在CKB中有cis(顺式)-pQTLs,对CARDIO-GRAM+C4D中的198个变体,进行MR分析,确定13个蛋白显示了与IHD潜在的因果关联。在欧洲人中鉴定的307个cis-pQTLs的独立MR分析重复了4种蛋白质的关联(即FURIN、F2R、ASGR1和MMP3)。进一步的下游分析表明,在内皮细胞中高表达的FURIN是一个潜在的新靶点,而MMP3是IHD的潜在再利用靶点。
案例2
2023年9月,Jing Sun等人在Genome Medicines期刊上(IF=12.3)发表了题为“Identification of novel protein biomarkers and drug targets for colorectal cancer by integrating human plasma proteome with genome”的文章。文章基于血浆蛋白质组与基因组,鉴定了几种与结直肠癌(CRC)风险相关的血浆蛋白,为结直肠癌(CRC)的病因学提供了新的见解,并为结直肠癌(CRC)筛查生物标志物和治疗药物的开发提供了有前景的靶点。
研究背景
结直肠癌(CRC)是第三大常见恶性肿瘤,也是癌症死亡的第二大原因,2020年全球新增病例190万,死亡人数90万。结直肠癌的生存率仍有待通过早期检测或靶向抗癌治疗来提高。因此迫切需要关于非侵入性早期诊断生物标志物和开发结直肠癌新治疗靶点的进一步证据。
先前的研究发现了多种循环蛋白与CRC风险相关,大规模蛋白质组学研究已鉴定出超过18000个蛋白质数量性状位点(pQTL),涵盖超过4800个蛋白质,其中包括超过1800个独立顺式pQTL。这些研究提供了宝贵的数据资源,可通过孟德尔随机化(MR)系统地阐明血浆蛋白对CRC风险的因果影响。
在这项研究中,作者通过将人血浆蛋白质组与基因组数据相结合,进行了蛋白质组范围的MR分析,以系统地识别与CRC风险相关的循环蛋白生物标志物,并对血浆蛋白与CRC风险之间的因果关联进行了全面研究,采用单细胞类型表达分析来检测结肠肿瘤组织中富集的细胞类型,并进行成药性评估,以探索其作为CRC治疗靶点的潜力。
研究思路
(1)基于7项已发表的CRC血浆蛋白质组全基因组关联研究(GWASs),寻找CRC可用的蛋白质数量性状位点(pQTLs)数据和GWAS研究数据;
(2)全蛋白质组孟德尔随机化(MR)分析、贝叶斯共定位分析、基于汇总数据的MR(SMR)+HEIDI分析,筛选出CRC可能的治疗靶点,并验证候选靶点蛋白与CRC之间的因果关系;
(3)进一步通过单细胞类型表达分析、蛋白-蛋白相互作用(PPI)和药物性评价,检测富集表达的特定细胞类型,优选潜在的治疗靶点。
图2 人血浆蛋白质组与基因组鉴定CRC的新型蛋白质生物标志物和药物靶点研究设计图(Jing Sun et al., 2023)。
研究结果
全蛋白质组MR分析鉴定出13种与CRC风险相关的蛋白,两种蛋白质(GREM1、CHRDL2)水平升高,11种蛋白质水平降低都与CRC风险增加相关,其中四种(GREM1、CLSTN3、CSF2RA、CD86)具有最令人信服的证据,可被优先考虑。这些蛋白编码基因主要在结肠肿瘤组织中的组织干细胞、上皮细胞和单核细胞中表达。两对相互作用的蛋白质(GREM1和CHRDL2;MMP2和TIMP2)被确定参与破骨细胞分化和肿瘤发生途径;同时另有四种蛋白(POLR2F、CSF2RA、CD86、MMP2)已被用于自身免疫性疾病和其他癌症的药物开发,并有可能重新用作结直肠癌的治疗靶点。
案例3
2023年6月,Davies Michael P A等人在eBioMedicine期刊上(IF=11.1)发表了题为“Plasma protein biomarkers for early prediction of lung cancer.”的文章。该文章基于血浆蛋白组学,确定了与肺癌状态显著相关的血浆蛋白,建立了预测肺癌诊断的模型,并在独立的观察数据集中对其进行了验证。
研究背景
肺癌是全球癌症死亡的最大原因,占所有癌症死亡的18%,预估有220万新癌症病例和180万人死亡。这与大多数肺癌被发现时已处于晚期密切相关,当没有更有效的治疗选择(例如手术)并且结果不佳时,与传统的症状诊断相比,低剂量CT(LDCT)筛查已被证明可以检测到更高比例的早期疾病,从而改善预后。然而,目前仅限于那些有明显吸烟史的人,因为这是筛查的关键决定因素。可是仅根据吸烟和年龄选择LDCT并不能充分考虑吸烟者因遗传或环境因素而存在的不同风险。
肺癌风险评估(不仅基于吸烟,还基于其他人口统计变量和病史)只能识别比如未来5~6年最有可能患肺癌的人。尽管目前已经有很多方法以及政策可以提高肺癌的检出率和早期诊断。然而,许多肺癌仍然被漏诊,要么是因为它们目前被排除在筛查之外,要么是因为筛查的采用率不理想。而利用微创生物标志物对风险进行生物学评估,可以扩大LDCT筛查的适用性,或者通过加强个人风险意识来鼓励更多人采用。
肺癌风险生物标志物(表明肺癌易感性)与诊断生物标志物(表明当前疾病的可能性)显著重叠。多种不同的生物标志物已被证明可以帮助肺癌的早期诊断,或者在没有LDCT筛查的情况下,但仍有未满足的临床需求和技术挑战。尽管如此,添加诊断性血浆蛋白生物标志物已被证明可以改善当前的风险评分,新的、更全面的发现平台为识别肺癌风险预测的生物标志物提供了更多机会。风险评估还可能有助于确定哪些人将从预防性医疗干预中受益,尤其血浆蛋白可能特别有利,因为它们为潜在的预防性治疗方法提供了生物学见解。
研究思路
(1)样本收集:来源于利物浦肺癌项目(LLP)参与者的血浆样本;
(2)血浆蛋白组学平台鉴定肺癌相关血浆蛋白;
(3)血浆蛋白组学结合基因集合富集分析;
(4)借助机器自学习发现肺癌预测蛋白标志物;
(5)肺癌预测建模并在英国生物银行(UKB)数据中进行验证。
图3 利物浦肺癌项目(LLP)研究设计(Davies Michael P A et al., 2023)。
研究结果
基于蛋白组学平台,研究团队采用利物浦肺癌项目(LLP)发现队列和英国生物样本库首发数据为验证队列,并借助机器学习模型,对肺癌诊断前不同时间采集的血浆样本进行了全面的血浆蛋白发现及基因集合富集分析,最终发现两组蛋白质在诊断前12年能够以相同的程度(AUC=0.7)预测肺癌。这为早期预测生物标志物及其随时间的变化提供了见解。其中,血浆蛋白质组学提供的肺癌蛋白质生物标志物,可用于在诊断前5年或更长时间识别肺癌最高风险人群。
参考文献
Davies Michael P A, Sato Takahiro, Ashoor Haitham, et al.Plasma protein biomarkers for early prediction of lung cancer.[J].EBioMedicine,2023,93104686-104686.
Jing Sun,Jianhui Zhao,Fangyuan Jiang, et al. Identification of novel protein biomarkers and drug targets for colorectal cancer by integrating human plasma proteome with genome[J].Genome Medicine,2023,15(1):75-75.
Mohsen M, Neil W, Pang Y, et al. Plasma Proteomics to Identify Drug Targets for Ischemic Heart Disease.[J].Journal of the American College of Cardiology,2023,82(20):1906-1920.