GPC1基因调节结直肠癌进展及预后的生物信息学分析

2021-04-28 05:37史维俊温贺新吴华彰刘牧林
赣南医学院学报 2021年3期
关键词:糖酵解直肠癌通路

陆 飞,史维俊,温贺新,吴华彰,刘牧林

(1.蚌埠医学院第一附属医院胃肠外科;2.蚌埠医学院生命科学学院 癌症转化医学安徽省重点实验室,安徽 蚌埠 233030)

结直肠癌是全球第2 大致死癌症和第3 大常见恶性肿瘤。2018年,结直肠癌新增病例180万,报告死亡病例88.1万人,占全球新增癌症病例和死亡人数的近10%[1]。尽管在治疗上有显著改善,但晚期患者死亡率仍然较高[2],局部复发和远处转移是结直肠癌患者死亡的主要原因[3]。因此,研究结直肠癌发生发展及预后相关机制及探索新的关键分子可以改善结直肠癌的预防、诊断和治疗。

与正常细胞相比,在不同氧浓度下,癌细胞将摄取更多的葡萄糖,大部分葡萄糖被分解成乳酸,这种现象被称作为“Warburg effect”或称“有氧糖酵解”[4]。癌细胞代谢需要更多的葡萄糖,相比正常细胞却产生了较少的ATP,抑制癌细胞有氧糖酵解成为治疗癌症的一种新策略。癌细胞有许多特性,包括高增殖、侵袭、转移和生存[5],与这些特性相关的癌症信号通路可能会被“Warburg effect”增强[6]。例如,PGAM1 受miR3614-5p 调控,通过激活转化生长因子-β(TGF-β)信号通路,在非小细胞肺癌的发生发展过程中发挥癌基因的作用[7]。

Glypican-1(GPC1)是磷脂酰肌醇家族(GPC1-6)的成员,也是一种硫酸乙酰肝素糖蛋白,通过与糖基磷脂酰醇的C 末端结合而锚定在细胞外膜上[8]。其在诊断早期胰腺癌中的特异性和敏感性达到100%,表明它是理想的胰腺癌早期标志物,且有研究表明它在其他类型的肿瘤中表达上调[9-11]。本研究通过TCGA数据库,利用GSEA富集糖酵解相关通路,获得GPC1在COAD中的表达信息及与临床数据的相关性,并应用R 软件分析GPC1 与结直肠癌临床进展的相关性及其对患者生存预后的影响。最后进一步通过KEGG通路富集,研究GPC1在调控结直肠癌中的机制,为研究结直肠癌分子机制提供新思路。

1 材料与方法

1.1 基 因 芯 片 数 据从 TCGA(https://cancergenome.nih.gov)数据库中下载完整的转录组数据和临床病理信息数据[12],其中有473 个结肠腺癌(Colon adenocarcinoma,COAD)样本和41 个相邻的非癌组织样本。

1.2 糖酵解相关通路基因富集及识别差异基因利用Perl 软件提取TCGA 数据库中的转录组数据,下载安装GSEA(http://software.broad-institute.org/gsea)。通过GSEA 软件进行糖酵解相关通路富集,将富集得到的基因通过R 软件的limma 包筛选出糖酵解相关差异表达基因[13]。

1.3 差异表达基因的生存分析及生存与临床病理信息的相关性分析从TCGA 数据库中提取相应的临床病理信息,包括年龄、性别、生存状态、生存时间、临床病理分期等。除去临床信息缺失的患者,利用单因素Cox 回归分析差异基因与COAD 患者总体生存相关的糖酵解相关基因,进一步利用多因素Cox 回归分析进行筛选。然后依据多因素Cox 回归分析得到的回归系数加权,通过风险评分中位值将COAD 患者分为低风险组和高风险组。通过Kaplan-Meier 曲线分析高低风险组的预后,且对数秩检验评估差异。最后进行生存与临床病理信息的相关性分析[14]。

1.4 预后相关基因的独立预后分析及验证通过Perl 软件将预后相关基因与临床病理信息进行整合,再利用R 软件进行单因素及多因素Cox 回归分析并对结果做森林图。将TCGA 转录数据重新分组,形成内部验证集,验证预后相关基因的可靠性。

1.5 预后相关基因与临床病理信息的相关性分析通过Perl 软件将预后相关基因表达数据与COAD 患者的年龄、性别、病理分级、TNM 分期及生存时间整合。并进一步利用R软件对临床病理特征进行Wilcox 秩和检验并作箱式图[15]。

1.6 目标基因临床病理特征的独立预后分析通过Perl 软件将目标基因与临床病理信息进行整合,再利用R 软件进行单因素及多因素Cox 回归分析并对结果做森林图。

1.7 目标基因的KEGG 富集分析通过Perl 软件将TCGA 转录数据组按照目标基因表达量分为高低两组,通过GSEA 软件进行KEGG 主要癌症信号通路富集分析,结果利用R软件进行可视化。

1.8 目标基因与潜在靶基因的相关性分析通过Perl软件获取目标基因相关信号通路分子的表达数据[16],然后通过R软件分析目标基因与其的相关性。结果以线性相关系数(R)及P 值表示,0.1≤|R|≤1 时表示目标基因与潜在靶基因具有相关性。

1.9 统计学处理本研究所有统计分析皆使用R 4.0.1(www.r-project.org)[17],P<0.05 为差异有统计学意义。

2 结 果

2.1 筛选差异基因通过Perl 软件提取TCGA 数据库中的473 例COAD 患者样本基因表达量,并利用GSEA 软件进行5 个糖酵解相关通路富集(表1),其中HALLMARK_GLYCOLYSIS 和REACTOME_GLYCOLYSIS 通路有统计学意义(P<0.05)(图1A和图1B),基因集中共含294 个基因(图1C),其中256 个基因差异表达(FDR<0.05,|log2FC|>0),145个基因表达上调和111 个基因下调(图1D)。以上结果说明大多数糖酵解相关基因在COAD组织中表达差异。

表1 在473例COAD样本中糖酵解相关通路富集的基因集

图1 TCGA数据库中糖酵解相关基因在COAD的差异表达分析

2.2 筛选预后相关基因及验证利用单因素及多因素Cox 回归分析(P<0.05,|log2FC|>0),筛选出基 因ANKZF1、ENO3、G6PC2、GPC1、PPARGC1 和STC2 与患者预后相关,依据6 个预后相关基因构建风险评分系统,并进行Kaplan-Meier 检验(P<0.001)(图2A)及ROC 曲线(图2B)验证其准确性(AUC=0.712);独立预后分析结果显示6 个预后相关基因构建的风险评分系统可以作为影响患者预后的独立因素(P<0.001)(图2C 和图2D);生存与临床病理信息相关性分析结果显示,患者的性别与预后无相关性(图2C 和图2D),进而通过性别分组验证评分系统的准确性。通过将患者的基因表达量依照性别分成2 组构建验证集,结果显示男性组低风险组患者预后好于高风险组(P<0.001)(图2E),女性组低风险组患者预后好于高风险组(P=0.027)(图2F)。以上结果说明ANKZF1、ENO3、G6PC2、GPC1、PPARGC1 和STC2 与患者预后相关,且与验证结果一致。

图2 预后相关基因的筛选及验证

2.3 预后相关基因与临床病理信息相关性分析预后相关基因与临床病理信息相关性分析结果显示(表2),GPC1 与患者(TCGA 数据库来源,除去部分信息缺失的患者)的肿瘤分级、TNM 分期均具有相关性(P 均<0.05)。推测GPC1 可能是参与结直肠癌发生发展的关键糖酵解相关基因。

表2 预后相关基因的生存分析及临床病理特征相关性

2.4 基因GPC1 在结直肠癌中差异表达情况进一步研究基因GPC1在TCGA数据库中的表达,分析发现GPC1 在COAD 组织中高表达(P=1.216e−05)(图3A);分析GPC1 在TCGA 数据库中82 例(41 例癌组织,41 例癌旁组织)配对COAD 癌组织及癌旁组织中的表达,发现GPC1在COAD癌组织中也显著的高表达(P=1.792e−05)(图3B)。推测GPC1 可能参与结直肠癌的发生发展。

图3 GPC1在COAD中的表达差异分析

2.5 基因GPC1 与临床病理信息的相关性分析基因GPC1 与临床病理信息相关性分析结果显示,GPC1与肿瘤分级和N分期具有极显著相关性(图4C和图4E),与T 分期、M 分期具有显著相关性(图4D和图4F),与年龄和性别无相关性(图4A和图4B)。

2.6 GPC1 生存分析及其与临床病理信息独立预后分析基因GPC1 的生存KM 分析结果显示基因GPC1 高表达与患者患者不良预后相关(P=0.018)(图5A),即GPC1 高表达缩短COAD 患者的生存时间;单因素及多因素Cox 回归分析独立预后结果显示(图5B 和图5C),GPC1 不是患者的独立预后影响因子。以上结果提示,基因GPC1 可能参与患者不良预后的生物学过程。

2.7 基因GPC1 的KEGG 通路富集分析KEGG通路富集结果是以主要癌症相关信号通路为筛选条件,按照P 值从小到大的顺序排列,基因GPC1 主要 影 响NOTCH、WNT、MAPK、VEGF、TGF- β、MTOR、ERBB和P53信号通路(表3,图6)。

2.8 基因GPC1 与潜在靶基因的相关性分析通过皮尔森检验基因GPC1 与各信号通路主要分子的相关性(图7),基因GPC1 与TGF 信号通路和VEGF信号通路中关键分子比尔森检验成中等程度相关(图7A 和图7B)。推测GPC1 可能通过TGF 信号通路和VEGF 信号通路影响结直肠癌细胞的增殖、侵袭及结直肠癌的预后。

图4 GPC1与临床病理信息的相关性分析

图5 GPC1基因表达与生存及临床病理信息的相关性分析

表3 基因GPC1单基因GSEA通路富集结果

图6 GPC1在主要癌症相关信号通路中的富集分析

图7 GPC1基因表达量与主要癌症信号中的关键分子皮尔森检验

3 讨 论

葡萄糖是细胞的主要能源物质之一,细胞依靠葡萄糖的能量代谢进行细胞的生长和分裂。癌细胞比正常细胞消耗更多的葡萄糖,即使在有足够的氧气情况下,它们也会将大多数葡萄糖代谢为乳酸,此过程被称作为“Warburg effect”或称“有氧糖酵解”[4],这种行为确实为癌细胞提供了一些明显的优势。首先,有氧糖酵解与氧化磷酸化相比实现了更高的ATP 产生率[18]。其次,通过有氧糖酵解途径可以提供大量生物合成所需的中间体。第三,有氧糖酵解在维持氧化还原平衡和调节染色质状态中起重要作用。第四,细胞的有氧糖酵解过程给细胞带来了低免疫力的微环境,并增强癌细胞的侵袭[19]。癌细胞的糖代谢异常越来越受到了人们的关注,大量的研究发现,癌基因通过糖酵解途径驱动癌细胞的发生发展[20-22]。然而,糖酵解相关基因在结直肠癌中的研究较少,因此,探索糖酵解相关基因在结直肠癌发生发展的机制可能是治疗结直肠癌的新途径。

本研究利用生物信息学方法,分析糖酵解相关基因在TCGA 数据库结直肠癌样本中表达差异,并通过生存分析获得预后相关基因,最后利用临床病理信息相关性分析得到基因GPC1。基因GPC1 是硫酸乙酰肝素蛋白聚糖的编码基因,在多种癌症中表达上调[23-25],参与多种重要细胞信号通路[26]。GPC1 是参与多种重要细胞信号通路的多功能表面蛋白聚糖[27],例如生长因子(FGF2),病毒蛋白,细胞因子和多胺[28],在人类的神经胶质瘤,胰腺癌和乳腺癌中GPC1 表达上调[29-30]。目前,关于GPC1 通过糖酵解途径影响结直肠癌的功能和机制缺乏相关的研究,且除糖酵解途径外GPC1 如何影响结直肠癌肿瘤发生发展机制也未清楚。本研究根据TCGA样本分析发现,基因GPC1 在COAD 中高表达,且与患者的预后不良相关。进一步分析发现GPC1 与COAD 生物学行为有关,例如GPC1表达量与患者肿瘤转移相关。有研究报道,GPC1 在结直肠癌肿瘤组织中高表达[31],miR-96-5p 和miR-149 的过表达抑制HT-29 和HCT-116 细胞中的GPC1 表达导致促进细胞凋亡并抑制细胞增殖[32]。为探索GPC1 在结直肠癌发生发展的具体分子机制,本研究按照GPC1在肿瘤中表达水平分中位值为界限,分为高、低表达两组进行GSEA 癌症主要相关信号通路富集。结果显示,基因GPC1在TGF信号通路和VEGF信号通路中富集(P<0.05),且GPC1 与TGF 信号通路和VEGF 信号通路中的关键基因TGF-β1、VEGFB 皮尔森检验呈中等程度相关关系。TGF-β1(转化生长因子β1)在癌症中的增殖、分化和凋亡中起着关键的调节作用[33-34]。它的上调抑制了肿瘤的早期生长,但促进了肿瘤的晚期生长,从而增强了肿瘤的恶性表 型[33-34]。VEGFB 属 于VEGF 蛋 白 家 族 成 员 之一[35],与VEGFR1 结合[35]。VEGF mRNA 在大多数人类肿瘤中过表达,且与浸润性、血管密度、转移、复发和预后相关[36]。基于以上结果推测基因GPC1可能通过TGF-β1增强TGF 信号通路,通过VEGFB增强VEGF信号通路在癌症中的作用。

在本研究中,通过TCGA 数据库中的COAD 样本分析,发现糖酵解相关基因在肿瘤组织与正常组织中表达差异,利用单因素及多因素Cox 回归分析得到预后相关基因,并进一步分析预后相关基因与临床病理信息的相关性,进而得到目的基因GPC1。最后通过GSEA 富集分析及皮尔森检验得到GPC1在结直肠癌作用的可能分子通路。本研究通过生物信息学方法对基因GPC1 进行深入的研究,在结直肠癌中的生物学行为及分子作用机制未得到实验验证。本研究的分析结果可能会对在结直肠癌的细胞糖酵解实验研究提供理论方向,也可能会成为治疗结直肠癌的新策略。

猜你喜欢
糖酵解直肠癌通路
非编码RNA在胃癌糖酵解中作用的研究进展
糖酵解与动脉粥样硬化进展
腹腔镜下直肠癌前侧切除术治疗直肠癌的效果观察
放射对口腔鳞癌细胞DNA损伤和糖酵解的影响
18F-FDG PET/CT中病灶糖酵解总量判断局部晚期胰腺癌放射治疗的预后价值
直肠癌术前放疗的研究进展
COXⅠ和COX Ⅲ在结直肠癌组织中的表达及其临床意义
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
GRP及GRPR在结直肠癌中的表达及意义