作者:杨徐,康春生,
近年来,多组学技术在胶质瘤中的应用迅速发展,深入揭示了肿瘤的分子机制,为个体化治疗和预后评估提供了新途径。目前,多组学技术在临床诊疗和预后评估中虽有提及,但缺乏系统分析。本文旨在总结多组学技术在胶质瘤诊疗和临床转化中的进展,并侧重总结了转录组学和单细胞测序的研究应用;同时对多组学技术在胶质瘤精准诊疗中的应用提出具体且具有可操作性的建议。
1.新型组学技术原理、研究进展及技术优势
1.1基因组学:近年来,基因组学揭示了许多驱动胶质瘤发生、发展的关键基因改变,为理解胶质瘤生物学及开发个性化治疗提供了重要线索。基因组学的技术原理是基于高通量测序确定DNA链中核苷酸的排列顺序,对生物体基因或整个基因组进行大规模分析并挖掘其生物学意义的学科。传统一代测序基于链终止法;二代测序通过大规模并行化反应实现高通量;三代测序则突破了读长限制,直接对单分子DNA进行实时测序。
根据目标区域可将基因测序策略分为3类,分别为全基因组测序、全外显子组测序和靶向测序,分别针对整个基因组DNA、编码蛋白质的区域和特定基因。癌症基因组图谱(the Cancer Genome Atlas, TCGA)项目对数千例胶质瘤样本进行全基因组测序和外显子组测序等,定义了经典型、间质型、神经型和前神经型4种主要的胶质瘤亚型,发现了IDH 和TERT等具有重要临床意义的分子标志物。研究发现,IDH1/2 基因在低级别和继发性胶质瘤中高频突变,导致细胞代谢途径改变,产生异常代谢产物2-羟基戊二酸(2-hydroxyglutarate,2-HG),进而影响DNA和组蛋白的甲基化状态。
IDH突变型和IDH野生型胶质瘤患者在临床病理特征、预后和治疗反应方面都存在显著差异,例如IDH突变型通常预后较好,对治疗手段更为敏感。TERT启动子突变也是TCGA发现的重要标志物之一,与肿瘤恶性程度和预后不良相关。这些成果为胶质瘤的精准诊断和个性化治疗提供了分子分型基础,推动了胶质瘤研究从传统分类深入分子层面的进程。基因组学已取得跨越式发展,其长读长测序技术显著提升了复杂基因组组装精度,测序成本大幅下降;同时,时空组学与单细胞技术的融合是再一次的技术进展。
此外,基因编辑与功能基因组学的协同进一步扩大了应用范围,例如CRISPR-Cas9技术。基因组学的技术优势是精准化疾病诊断与治疗,基因组大数据与人工智能(artificial intelligence, AI)结合实现了复杂性状预测,推动了智能设计疾病风险建模。尽管基因组学技术优势显著,但仍需解决测序准确性、编辑脱靶效应及伦理问题。
1.2转录组学:转录组学在胶质瘤的研究中发挥重要作用,能够动态分析肿瘤转录组并揭示非编码RNA对肿瘤调控的重要性,主要分为微阵列技术和RNA测序(RNA-seq)。微阵列技术具有高通量、成本低且技术成熟等优势,局限性是依赖已知基因信息、无法检测新转录本、敏感度受探针设计限制。RNA测序利用高通量测序技术比对和统计模型量化反转录的cDNA文库、识别剪接变体,具有无预设探针、高敏感度、检测低丰度转录本、支持全转录组分析等优势,局限性为数据复杂度高、计算资源需求大、存在PCR扩增偏差等。新兴转录技术拓展了单细胞转录组学(scRNA-seq)和空间转录组学,其中scRNA-seq通过微流控或液滴分选技术分离单个细胞,而空间转录组学结合组织切片原位捕获与测序技术保留基因表达的空间信息。
scRNA-seq的技术革新正在突破组织层面的研究局限,实现肿瘤微环境中细胞异质性的精准解构。空间转录组结合原位测序技术发现肿瘤核心区与侵袭边缘的细胞呈现显著转录差异,利用scRNA-seq将空间分辨率整合到单细胞数据集以剖析癌症微环境背景的价值。随着高通量测序技术的发展,scRNA-seq更加真实地构建了胶质瘤单细胞分辨率的“细胞景观图”。
有团队建立了单细胞核测序平台snHH-seq并且证明了高分辨率单细胞核全长转录组测序对于识别新型肿瘤生物标志物的价值。表观遗传学是研究不改变DNA序列的情况下基因表达发生可遗传变化的学科,例如O6-甲基鸟嘌呤-DNA甲基转移酶(O6-methylguanine-DNA methyltransferase, MGMT)基因的启动子甲基化状态与胶质瘤患者对烷化剂化疗药物的敏感性密切相关。
此外,组蛋白修饰是表观遗传学调控的重要组成部分。组蛋白H3第27位
1.3蛋白质组学:蛋白质组学技术的发展促进了肿瘤细胞贴近表型的生物学相关性(反映翻译后修饰等调控机制)分析。质量光谱分析是蛋白质组学研究的核心工具,能够对复杂的蛋白质混合物进行高通量、准确的定性和定量分析,主要分为液相色谱串联质谱、基质辅助激光解吸电离质谱和定量质谱等,其中蛋白质微阵列主要研究蛋白质互作、酶活性以及抗体与抗原的结合等,适用于筛选疾病相关的生物标志物。
免疫沉淀-质谱结合了免疫沉淀技术和质谱分析,用于研究特定蛋白质及其相互作用网络,揭示了蛋白质间的相互作用和通路的变化。磷酸化是最常见的蛋白质翻译后修饰之一,磷酸化组学能够系统性分析肿瘤细胞中的磷酸化位点,探索信号通路的激活情况及其对细胞增殖的影响。蛋白组学技术进展主要有超灵敏质谱技术、微流控技术和多样本检测。
1.4代谢组学:胶质瘤代谢的关键特征包括糖酵解优势/Warburg效应、
与传统方法相比,代谢组学的优势包括高敏感度、动态监测性和技术通用性等,且近几年的突破性进展较多,如AI驱动的代谢物注释通过机器学习加速未知代谢物鉴定并提升注释效率;空间代谢组学结合质谱成像技术实现代谢物空间定位;纳米流液质联用技术的敏感度达飞摩尔级,适用于单细胞代谢组解析肿瘤微环境代谢异质性。
高分辨质谱数据中大量未知代谢物的结构解析以及大样本研究中实验条件标准化是目前的一个难题,临床应用中需进一步降低成本并提升分析速度以提高时效性。未来,代谢组学将与AI、空间组学深度融合,推动精准医学和个性化治疗的发展。
2.多组学技术在胶质瘤诊断、预后及治疗中的应用
2.1基因组学:基因组学技术在胶质瘤领域深刻改变了诊断、治疗及预后评估,其核心在于通过个体化解析肿瘤基因组的变异特征,实现精准医学的转化。基因组学推动了胶质瘤分子分型进展,1p/19q共缺失、IDH突变和TERTp启动子突变等分子标志物为临床诊断和预后评估提供了依据。基因组学如二代测序能够识别肿瘤中的特定基因突变,指导临床医生选择适合患者的靶向治疗,联合基因疗法制订个性化方案。
针对IDH1/2 突变的抑制剂Vorasidenib和Ivosidenib在临床试验中显示可延长无进展生存期,尤其适用于复发或进展性低级别胶质瘤。全基因组关联研究通过识别与胶质瘤预后显著相关的单核苷酸多态性并结合年龄、性别、手术和化疗等因素开发预测胶质瘤患者不同生存率/风险组的模型。尽管基因组学在胶质瘤诊断和治疗中取得了显著进展,但其样本量小、技术复杂、缺乏标准化指南等仍需解决。
2.2转录组学:转录组学通过解析分子特征显著提升了胶质瘤分类的精准性,例如中国脑胶质瘤基因组图谱计划(Chinese Glioma Genome Atlas,CGGA)存储和分析海量脑肿瘤数据;空间转录组学技术揭示了胶质瘤和弥漫性中线胶质瘤中放射状胶质干细胞样细胞的生态位富集,为组织病理学分型提供了分子补充。转录组学为靶向治疗和免疫治疗提供了新方向。单细胞测序发现,肿瘤相关巨噬细胞亚群SIGLEC9+在免疫检查点抑制剂耐药患者中高表达,靶向抑制该通路可增强治疗响应。
针对H3K27M突变型胶质瘤,转录组特征指导的ONC201疗法的临床试验显示其显著生存获益。其次,scRNA-seq技术突破了传统Bulk测序的局限,解析了胶质瘤微环境中细胞亚群的动态变化,揭示了肿瘤异质性、细胞间通讯及免疫逃逸的关键机制,例如利用scRNA-seq厘清弥漫性胶质瘤中单核细胞衍生的肿瘤相关巨噬细胞(Mo-TAMs)的多样性和以空间龛为中心的Mo-TAM重编程,并发现针对缺氧-TAM的潜在疗法可使肿瘤血管正常化,促进胶质瘤异种移植物的药物输送。此外,表观遗传修饰也起到指导临床诊断和治疗胶质瘤的作用。
自2021年WHO病理分类引入了基于表观遗传特征的生物标志物,如EGFR 扩增、7号
2.3蛋白组学:蛋白组学提供多维度信息,在胶质瘤机制研究、生物标志物发现和药物靶点筛选中具有重要应用价值,例如通过空间蛋白组学技术发现胶质瘤的复发与ROBO1信号通路激活相关,且靶向ROBO1的CAR T细胞疗法在小鼠模型中显著延长生存期。
串联质谱标签整合磷酸化蛋白质组学发现,IDH突变胶质瘤中组蛋白乙酰化模式与免疫亚型相关,靶向BRD/CREBBP可逆转耐药性。蛋白质组学在胶质瘤预后评估中的应用主要有风险评分模型和微环境解析。
目前,蛋白组学正在推动胶质瘤研究从分子分型到精准治疗的跨领域转变,然而技术敏感度、样本处理及数据整合仍是主要瓶颈。(1)胶质瘤中关键信号蛋白丰度很低,传统质谱技术敏感度不足。(2)胶质瘤的高异质性导致样本高复杂性,术中快速检测需解决组织前处理耗时问题。除此之外,数据分析与标准化面临算法复杂性挑战。
2.4代谢组学:代谢组学通过分析肿瘤代谢物谱的异常变化为胶质瘤的分子分型和早期诊断提供了新工具。通过蛋白质组学将胶质瘤分为免疫亚型和神经-代谢亚型后,发现嘧啶代谢相关酶DPYD和TYMP在胶质瘤干细胞增殖中起关键作用,抑制这些酶可显著延长小鼠生存期。代谢物谱与胶质瘤恶性程度及生存率密切相关,目前,已建立多个预后生存预测模型。
乳酸代谢与脂质代谢在胶质瘤进展中的应用及免疫微环境互作研究是代谢组学的重点。代谢组学发现,乳酸通过激活TGF-β/Smad和Wnt/β-catenin通路诱导上皮-间质转化,促进侵袭。乳酸积累导致肿瘤微环境酸化,通过HIF-1α促进VEGF分泌和M2巨噬细胞极化,形成免疫抑制性微环境。
代谢重编程为胶质瘤提供了代谢优势,同时也揭示了多种治疗靶点,尤其在靶向IDH1突变代谢通路、糖酵解和核苷酸代谢中取得重要突破,例如抑制乳酸脱氢酶、正在开发的
3.多组学数据的整合策略
3.1必要性:基因组学可识别驱动胶质瘤发生、进展的关键基因改变,如全基因组测序发现胶质瘤中特有的“突变负荷”现象,转录组学能揭示肿瘤中基因表达变化,RNA测序确定了PI3K/AKT/mTOR信号通路及相关非编码RNA在胶质瘤中的作用,蛋白质组学通过分析蛋白质表达、修饰和相互作用发现了如YKL-40和osteopontin等与胶质瘤侵袭和预后相关的蛋白,代谢组学明确了胶质瘤代谢重编程特征,为靶向治疗提供了靶点。
单一组学仅聚焦于单一生物分子层面,其观测维度的局限性导致无法捕捉生物系统的动态复杂性,例如基因组学难以反映时空特异性的基因表达调控并缺少动态性,转录组学实时反映基因表达调控但与蛋白质水平相关性低,蛋白组学的高丰度蛋白易掩盖低丰度信号。代谢组学虽作为基因-环境互作的终点,但难以溯源表型变化的上游分子机制。现有的单一组学检测技术和设备易产生片面性的假阳性结果。多组学技术通过整合跨层次(DNA-RNA-蛋白质-代谢物)和跨时空(发育阶段/疾病进程)的多维数据能够构建动态调控网络模型,从而系统、连贯地解析生命现象背后的分子互作规律、层级调控机制及环境扰动响应模式,加速从分子发现到临床干预的转化进程。
3.2整合方法:机器学习驱动的整合方法在多组学中展现独特优势,包括以下几种。
(1)集成学习方法:通过结合多个模型的预测结果提高整体性能,例如随机森林通过构建多个决策树并统一预测结果,常被用于癌症亚型分类、基因表达模式分析和药物反应预测等场景。
(2)深度学习:通过模拟人脑神经网络结构自动提取特征并实现复杂任务,被广泛应用于基因表达预测、蛋白质功能预测、疾病诊断和影像组学等领域。分层自编码器在
(3)无监督学习:方法如聚类分析和主成分分析在多组学整合中被用于发现数据中的潜在模式和结构,以揭示生物标志物和疾病机制;多模态数据整合被用于识别与疾病相关的基因特征,并通过构建预测模型提高诊断和治疗的准确性。
3.3数据分析策略:多组学整合体系可分为以下三大层次。
(1)概念性整合:即独立分析各层数据后交叉验证结论。
(2)统计性整合:即利用矩阵分解、网络分析等算法挖掘多组学关联。
(3)基于模型的整合类型:即整合先验知识构建预测模型。通路富集的层次化分析是多组学整合的必要条件,例如转录组学与蛋白组学的联系本质上是基因表达调控网络从“蓝图”到“执行”的全流程解析。数据分析策略的未来发展方向主要包括动态互作网络建模、翻译后修饰的系统整合和临床可操作技术开发。
3.4技术难题:多组学整合受限于技术和临床转化的复杂问题,其全面推广仍面临系统性挑战。
(1)不同组学的标准化方法、动态范围和分布差异显著,导致整合前需分别进行插补、异常值检测和归一化处理。此外,实验条件差异引发的数据格式和存储结构不一致进一步增加了复杂性。
(2)存在噪声问题。特征维度远高于样本量导致计算成本上升、模型过拟合及冗余特征干扰。
(3)存在跨学科协作壁垒。生物学、统计学和计算机科学等多领域间术语差异和方法论鸿沟常导致协作效率低下,而存储与共享瓶颈也是待解决的问题。针对以上难题,通过合理应用降维技术、云计算和跨平台工具开发,可以有效提升开发效率和系统性能,实现技术转型。降维技术和云计算提供了强大的基础设施支持,能够帮助快速部署和弹性扩展资源,降低运维成本。云计算平台还支持跨平台服务集成和资源协同,通过统一管理多个云平台,提高资源统一调度和全自动管理,突破传统运维瓶颈。跨平台开发工具如ComBat-omics、React Native、Flutter等能够帮助开发者在多个操作系统和平台上开发和部署应用程序,提高开发效率和代码可维护性,消除批次效应。
3.5多组学整合推动胶质瘤诊断早期化、精准化和个性化治疗等方面的典型应用:多组学技术在胶质瘤领域取得了一系列核心进展,例如国际癌症基因组联盟(International Cancer Genome Consortium,ICGC)对胶质瘤开展了深入研究,通过对全球多中心样本的多组学分析,进一步丰富了对胶质瘤分子机制的认识,在揭示肿瘤发生、发展的分子通路以及发现新的潜在治疗靶点等方面贡献颇丰。
Chen等整合全基因组、转录组及甲基化数据,揭示了脑干胶质瘤的甲基化异质性,提出基于甲基化状态的四分类法(H3-桥脑型、H3-延髓型、IDH 型及类毛细胞型),其中H3K27M突变型延髓胶质瘤具有独特的免疫相关通路异常机制,为临床精准诊断提供了分子标志物。液体活检联合多组学已在胶质瘤临床中应用。
血浆代谢组学的研究发现,尿嘧啶、
映射空间异质性也是多组学技术的优势之一,空间转录组能够识别胶质瘤侵袭边缘的CHI3L1 高表达区域,空间蛋白质组则发现该区域YKL-40蛋白富集并驱动血管生成,指导局部给药策略。整合磷酸化蛋白组与基因组数据对胶质瘤进行分型,其中PKCδ激活型对MEK抑制剂selumetinib敏感,而DNA-PK依赖型对PARP抑制剂奥拉帕尼的响应率高达67%。该分型系统已转化为临床检测试剂盒,准确率达89%。
多组学整合微生物组-宿主互作研究被广泛应用并取得显著成果,例如单细胞转录组能够鉴定胶质瘤干细胞亚群,而空间蛋白质组可以定位该群体在血管周围生态位的HIF-1α 蛋白梯度分布,揭示了胶质瘤微环境驱动干性维持的机制。联合分析可提高标志物筛选的特异性与临床转化潜力,例如标志物层级筛选、耐药机制的多组学解码以及融合基因的功能确证等的应用。单细胞多组学技术在胶质瘤靶向治疗中具有突破性应用,有研究团队通过单细胞转录组测序研究胶质瘤微环境动态变化,开发了双特异性抗体,延长了小鼠生存期并使肿瘤浸润CD8+ T细胞比例提升3倍。随着技术创新与临床转化体系的完善,多组学有望在未来10年内使胶质瘤5年生存率提高至30%以上。
4.多组学在胶质瘤中的临床转化与未来方向
基于多组学数据的分子分型已显著改变了胶质瘤的临床分类和治疗方法,例如通过全球最大的胶质瘤多组学数据库开发优化CAR-T细胞疗法,其靶向性设计显著提高了实体瘤治疗效果,而液体活检通过检测脑脊液或血液中的循环肿瘤DNA、外泌体等标志物为胶质瘤无创监测提供了可能。胶质瘤是高度异质性的CNS肿瘤,单中心研究因地域限制和样本量不足,需设计多中心前瞻性队列研究以更好地验证多组学技术标志物的临床效能。然而,多中心队列的跨机构数据共享需借鉴加权分析方法调整异质性,而脑脊液活检等新兴技术需建立去标识化数据处理流程保护患者隐私。
从德国国家队列研究的标准化数据架构到AI工具OmicsFootPrint的驱动分析,技术创新提供的革命性工具持续推动着精准医疗的边界。与传统生物信息学方法相比,深度学习模型具有以下优势,即处理高维异构数据能力、捕捉非线性关系和实现端到端特征学习,例如DeepGlioma模型整合多参数MRI与单细胞转录组数据,可实时预测术中样本的IDH状态和1p/19q共缺失状态,指导手术边界划定。AI技术未来发展趋势呈现以下三大特征,即动态整合、多尺度融合和临床转化加速。
综上所述,多组学整合了重构生命科学方法论,机器学习与云计算的融合有望突破技术瓶颈,但需统一质控标准与解释框架,并通过跨学科协作实现数据价值转化。
来源:杨徐,康春生,刘晓民.多组学在胶质瘤诊断与临床转化中的研究进展[J].神经疾病与精神卫生,2025,25(08):533-539.