单细胞测序技术改变了我们对人体组织的理解,但单一研究通常样本数量有限,并且在细胞类型定义上存在分歧,将多个单细胞数据集整合可以消除单一研究的局限性,识别人群水平的变异性,促进对健康和疾病组织间差异的理解。
在最近的《自然·医学》杂志上,一个国际研究团队发表了迄今最大最全面的人类肺细胞图谱(HLCA),整合了49个人类呼吸系统数据库的数据,包含486名参与者的超240万个细胞。研究的通讯作者来自德国亥姆霍兹慕尼黑中心计算生物学研究所和肺健康与免疫研究所[1]。
HLCA根据匹配的标志基因标注了不同的细胞类型,包含一些罕见的和之前未被发现过的,并且突出了健康人之间的细胞差异。使用HLCA作为疾病研究的参考,研究团队还确定了多种肺部疾病的共享细胞状态,例如COVID-19、肺纤维化和肺癌中的SPP1+促纤维化单核细胞衍生巨噬细胞,这为我们理解肺部疾病提供了新的思路,同时有助于确定新的治疗靶点。
为了构建HLCA,研究人员首先从14个数据集中收集了单细胞RNA测序数据和详细的、统一的技术、生物学和人口统计学元数据,包含107名年龄、性别、种族、BMI和吸烟状况不同的参与者的166个组织样本。
他们将样本的解剖位置投射到一维公共坐标框架(CCF)上,代表呼吸系统由近端到远端,以标准化解剖位置起源,并且构建了五级分层细胞身份参考框架,将每个数据集收集的细胞身份标签映射到分层参考框架中,统一了细胞类型命名,计算出了每个样本不同细胞类型的比例。
经过整合,研究人员建立了HLCA的核心,在此基础上,再将35个额外的包含疾病样本的数据集映射到HLCA核心,将图谱包含的细胞总数扩展到240万个。
HLCA概览
HLCA识别出了6种以前未在人类肺组织中发现或仅在个别研究中发现的细胞,包括迁移树突状细胞(312个)、造血干细胞(60个)、高度增殖性丘状上皮细胞(4600个)、0型肺泡细胞(1440个)、末端前细支气管分泌细胞(4393个)和一个平滑肌细胞亚群(335个),这个平滑肌细胞亚群绝大多数存在于气道中,表达典型的平滑肌细胞标志物CNN1和MYH11以及独特的标志物FAM83D。
人口统计学和其他因素会影响细胞转录表型,例如,性别与淋巴内皮细胞的转录组变异相关性最高,BMI与B细胞和T细胞的变异相关性最高,吸烟状况与先天淋巴细胞/自然杀伤细胞变异相关性最高,这有助于研究人员了解性别、BMI和吸烟等风险因素对肺部组织由健康状态进展到疾病状态的影响。
在疾病的单细胞研究中,需要足量的匹配对照样本,才能正确识别疾病特异性变化。此前有研究认为,ACKR1在肿瘤内皮细胞中特异性高表达,与不良预后相关,而基于本研究中多个映射数据集和HLCA的对照,ACKR1在健康组织中表达也很多,尤其是静脉内皮细胞,这表明ACKR1并非是肿瘤特异性内皮细胞标志物。因此,HLCA可以为疾病研究提供全面的健康对照,防止将采样和实验设计中的局限性误解为健康与疾病组织之间的差异。
此外,HLCA还能够为全基因组关联研究(GWAS)等大规模的疾病遗传学研究提供全面可靠的背景参考。
基于先前的GWAS,HLCA细胞类型与四种不同肺部状态的关联
由于纳入了包含疾病样本的数据集,HLCA也可以提供对疾病特异性细胞状态的参考。
以特发性肺纤维化(IPF)为例,基于以前的单一研究,研究人员发现,与健康对照相比,IPF样本中被标记为肺泡成纤维细胞的细胞一致表现出高不确定性,而基于HLCA和纳入的IPF数据集,肺泡成纤维细胞聚类分析表明,IPF患者来源的细胞绝大多数都聚集在一个类群中,特征为高表达IPF相关基因(CCL2、COL1A1、CTHRC1和MMP19),以及纤维化相关标志物,包括细胞外基质分解抑制因子SERPINE1和慢性缺氧反应基因HIF1A。
HLCA包含是多种肺部疾病的数据,此前的研究在IPF、COVID-19和肺癌中均发现了促纤维化的SPP1+单核细胞衍生巨噬细胞(MDM),研究人员利用HLCA复现了这一发现。
他们对HLCA中所有的MDM进行了聚类分析,确定了四种主要的MDM亚型,有不同的基因表达和疾病富集模式,代表了单核细胞到MDM分化和适应疾病微环境的不同阶段。
第一种为早期和炎症性MDM(聚类2),高表达CCL2,主要来自COVID-19肺炎患者病程早期的肺泡灌洗液样本,第二种为表达炎症和吞噬作用相关基因的MDM(聚类4),在COVID-19肺炎和肺癌患者中富集,第三种是分化程度更高的MDM(聚类3),主要来自非疾病样本,第四种MDM高表达SPP1、LPL 和CHIT1(聚类0),主要来自IPF样本,同时也在COVID-19病程晚期死亡和COVID-19后发展为肺纤维化,以及肺癌患者样本中富集。
不同MDM在疾病状态的数量和标志基因
SPP1、LPL和CHIT1都已经被证明在肺纤维化发展中发挥因果作用,CHIT1更是目前在研的IPF治疗靶点。这表明,COVID-19病程晚期和肺癌与IPF“共享”部分MDM纤维化表型,有可能加速发现有效的疾病疗法。
总的来说,这项研究作为全球人类细胞图谱计划的一部分,建立了目前首个完整的人类肺部单细胞图谱,以健康肺部细胞为核心,辐射十余种肺部疾病数据。参与了研究的美国西北大学范伯格医学院的研究人员表示,HLCA作为第一个主要器官的完整参考图谱,是实现完整人类细胞图谱的里程碑,将改变我们对生物学和疾病的理解。
参考文献:
[1] Sikkema L, Ramírez-Suástegui C, Strobl D C, et al. An integrated cell atlas of the lung in health and disease[J]. Nature Medicine, 2023: 1-15.
文章来源:奇点网