基于生物信息学方法筛选前列腺癌中的关键表达基因及其对预后影响的分析

2023-03-05 12:11张冠杨登科
现代泌尿生殖肿瘤杂志 2023年3期
关键词:差异基因前列腺癌生化

张冠 杨登科

前列腺癌是男性泌尿生殖系统最常见的恶性肿瘤之一,其发病率呈逐年升高趋势,很多患者在初诊时已属中晚期。临床诊疗中,患者在接受常规的内分泌治疗无效后会面临疾病进展、生活质量下降、生存期缩短等问题[1],一部分病例经内分泌治疗、手术治疗或化疗后仍存在生化复发或转移可能。本文旨在通过基因芯片技术和生物信息学方法,分析前列腺癌中的关键表达基因、信号通路以及蛋白质相互作用网络,并进行前列腺癌生化复发和转移事件的生存分析和Cox回归分析,从而寻找潜在的治疗靶点,为前列腺癌的生化复发和转移事件提供新的诊疗思路。

对象与方法

一、数据来源

从基因表达综合(Gene Expression Omnibus, GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载前列腺癌相关的基因芯片数据集(GSE200879和GSE116918)。GSE200879发表于2022年5月,包含由实验平台GPL32170提供的137例临床样本,其中正常样本9例,前列腺癌样本128例。GSE116918发表于2018年7月,包含由实验平台GPL25318提供的248例前列腺癌样本,并对其进行前列腺癌生化复发和转移事件的随访。

二、数据标准化

利用R软件对基因芯片数据集(GSE200879和GSE116918)进行初步处理及标准化。首先,使用平台文件将基因探针转换为基因名,并对相同基因的表达量取平均值,然后使用“最近邻居法”补充缺失值,最后使用标准化函数对数据进行标准化,并用箱线图对标准化后的数据进行可视化检验,以确保后续数据生物信息学分析的有效性和可靠性。

三、筛选差异基因

利用limma包并使用过滤条件(差异表达倍数的对数绝对值>2,并且调整后的P<0.05),筛选出GSE200879中正常样本和前列腺癌样本的差异表达基因。

四、基因功能富集分析和信号通路富集分析

使用clusterProfiler包进行基因本体(Gene Ontology, GO)及京都基因和基因组百科全书(Kyoto Encyclopaedia of Genes and Genomes, KEGG)分析,然后使用过滤条件(调整后的P<0.05)筛选差异基因主要富集的功能和通路,并绘制柱状图对结果进行可视化。

五、构建蛋白质相互作用网络

利用在线分析工具STRING网站(https://cn.string-db.org/)和Cytoscape软件对筛选出的差异基因构建蛋白质相互作用网络,并筛选出关键靶点。

六、差异基因对前列腺癌生化复发和转移事件的影响分析

提取标准化后的GSE116918中差异基因的表达量,根据基因表达的中位值将前列腺癌患者分为低表达组和高表达组,并与生化复发和转移事件的数据关联。然后使用survival包和survminer包分析差异基因对前列腺癌生化复发和转移事件的影响,生存分析采用Kaplan-Meier法,并绘制生存曲线。

七、前列腺癌生化复发和转移事件的多因素Cox回归分析

使用函数cox.zph验证PH假设,然后使用survival包和survminer包构建多因素Cox回归模型,因变量为前列腺癌生化复发和转移事件的随访时间和随访状态,自变量为年龄、PSA值、T分期、Gleason评分和差异基因(TDRD1、CRISP3、OR51E2、SIM2、HPN、PGM5-AS1、BMP5、PCAT4、KRT15、KRT13、KRT5、VSNL1、GSTM1、OLFM4、SLC14A1、CYP3A5),最后绘制森林图。

结 果

一、筛选差异基因

从GSE200879中筛选出3 314个差异表达基因,其中1 664个基因表达下调,1 650个基因表达上调。进一步使用过滤条件筛选出22个基因,其中15个基因表达下调,7个基因表达上调。按照差异表达倍数由大到小排列,15个下调基因依次排序为SCGB1A1、CYP3A5、SLC14A1、OLFM4、GSTM1、UPK1A、VSNL1、CD177、GPX2、KRT5、KRT13、KRT15、PCAT4、BMP5、PGM5-AS1;7个上调基因依次排序为PCA3、TDRD1、CRISP3、AMACR、OR51E2、SIM2、HPN。对筛选出的22个差异基因进行相关性分析,发现表达上调的基因与其他上调基因呈正相关关系,而与下调基因呈负相关关系,表明这些差异基因可能存在共表达或表达调控关系。

二、基因功能富集分析和信号通路富集分析

GO分析发现,KRT5、KRT13、KRT15基因主要富集在中间丝组织、中间丝细胞骨架组织和基于中间丝的生物过程;CYP3A5、GSTM1基因主要富集在分解代谢过程;HPN、BMP5基因主要富集在激素代谢过程和上皮向间充质转化的负调控过程。KEGG分析发现,GPX2、GSTM1基因主要富集在谷胱甘肽的代谢过程;CYP3A5、GSTM1基因主要富集在化学致癌、细胞色素P450药物代谢及其对外源物质的代谢过程;KRT13、KRT15基因主要富集在金葡菌感染、雌激素的信号通路过程。

三、蛋白质相互作用网络构建

使用过滤条件(差异表达倍数的对数绝对值>1.5,并且调整后的P<0.05)筛选出97个差异基因,基于STRING网站和Cytoscape软件构建蛋白质相互作用网络图。我们发现上调基因中,HPN、AMACR、CRISP3基因表达的蛋白质间存在相互作用,下调基因中KRT5、KRT13、KRT15、UPK1A、SCGB1A1、CYP3A5、GSTM1、GPX2基因表达的蛋白质间存在相互作用。

四、差异基因对前列腺癌生化复发和转移事件的影响分析

分析发现,PGM5-AS1、CD177、GSTM1、SLC14A1、OR51E2、KRT13基因高表达患者的无生化复发生存率显著高于低表达患者;PGM5-AS1、CD177、GSTM1、SLC14A1、KRT15、KRT5基因高表达患者的无转移生存率显著高于低表达患者。

五、前列腺癌生化复发和转移事件的多因素Cox回归分析

使用函数cox.zph验证PH假定,我们发现纳入的变量均符合PH假定。多因素Cox回归分析结果显示,SIM2基因(HR=0.405,95%CI:0.245~0.670,P<0.001)是前列腺癌生化复发事件的保护因素,T分期(HR=1.649,95%CI:1.051~2.588,P=0.030)和BMP5基因(HR=1.907,95%CI:1.006~3.614,P=0.048)是前列腺癌生化复发事件的危险因素;SIM2基因(HR=0.385,95%CI:0.173~0.858,P=0.020)是前列腺癌转移事件的保护因素,HPN基因(HR=7.513,95%CI:1.886~29.924,P=0.004)是前列腺癌转移事件的危险因素。

讨 论

关于前列腺癌的分子机制和诊疗靶点,国内外已有很多相关研究,但均缺乏足够的理论支撑和证据等级,这也限制了相关研究在临床实践中的应用。我们使用生物信息学方法筛选出前列腺癌中的差异表达基因,其中7个基因表达上调,按照差异表达倍数由大到小依次排序为PCA3、TDRD1、CRISP3、AMACR、OR51E2、SIM2、HPN。通过查阅文献发现,PCA3基因在大多数前列腺癌细胞中高表达,且有研究认为PCA3的表达水平与病情进展呈正相关,可以作为前列腺癌诊断的标志物[2]。最近的一项研究表明,PCA3作为前列腺癌的标志物,具有良好的特异性和敏感性,并且PCA3与PSA联合在前列腺癌的诊断中发挥着重要作用[3]。TDRD1是原发性前列腺癌中ERG过表达的直接上调靶基因,可以作为一种新的前列腺癌生物标志物[4-5]。此外,作为前列腺癌的原癌基因,CRISP3与前列腺癌的侵袭和进展关系密切,被证实为前列腺癌的潜在治疗靶点[6]。CRISP3是前列腺癌的上调基因之一,其在前列腺癌细胞中的表达具有雄激素依赖性,CRISP3启动子受雄激素受体的表观遗传调控[7]。CRISP3高表达是前列腺癌生化复发预后不良因素之一[8]。有学者对AMACR基因在前列腺癌中的作用进行了研究,认为敲除AMACR会导致细胞增殖能力下降、凋亡率增加,AMACR基因在前列腺癌的进展中可能发挥着致癌作用[9]。也有报道指出,对于精液中的AMACR蛋白检测可成为前列腺癌诊断中的一种非侵入性检查[10]。不仅如此,OR51E2激动剂可通过激活前列腺癌中的细胞外信号调节激酶1和2发挥致癌作用[11]。OR51E2基因在人前列腺癌上皮细胞中特异性高表达[12],能促进前列腺癌的侵袭和转移[13]。有研究表明SIM2是前列腺癌显著上调基因之一,并且其表达与临床病理因素相关[14]。HPN基因是前列腺癌常见的高表达基因,一项研究指出HPN基因的变异可能与前列腺癌的发生风险有关[15]。综上,本研究筛选出的上调差异基因与既往的相关研究相符,进一步验证了本研究的有效性与可靠性。

在下调基因中,PGM5-AS1、GSTM1、SLC14A1基因在前列腺癌的发生、发展中起着十分重要的作用。有研究表明,PGM5-AS1通过竞争性结合miR-587,从而上调GDF10基因的表达,抑制前列腺癌细胞的增殖并促进其凋亡[16]。此外,有研究认为GSTM1基因缺失与亚洲人群前列腺癌的发病风险增加显著相关[17]。最近的一项研究指出,与正常前列腺上皮细胞相比,SLC14A1基因在前列腺癌细胞中的表达显著降低,并且Kaplan-Meier生存分析显示,SLC14A1高表达可延长前列腺癌患者的无生化复发生存时间[18],这与本研究的结果相符。

在信号通路的相关研究中,雄激素依赖性的信号通路在前列腺癌内分泌治疗中发挥着重要作用,此外雄激素非依赖性的信号通路也参与了前列腺癌的进展。有研究认为松弛素与雄激素在胞内信号通路中存在着相互作用,并且可能是雄激素非依赖性前列腺癌新的治疗靶点[19]。WNT信号通路在前列腺癌的进展中也发挥着重要作用[20]。有研究表明脂质代谢通路与前列腺癌的侵袭和进展密切相关[21]。综上,多种信号通路共同调控前列腺癌的发生和进展。在对差异基因对前列腺癌生化复发和转移事件的影响分析中,我们发现PGM5-AS1、CD177、GSTM1、SLC14A1基因高表达能显著延长前列腺癌患者无生化复发生存率和无转移生存率。在前列腺癌生化复发和转移事件的多因素Cox回归分析中,我们发现SIM2基因表达是前列腺癌生化复发和转移事件的保护因素。以上结果可为前列腺癌的临床诊疗提供新的诊疗思路。

本研究也存在一些局限性。首先,本研究所选取的样本来源于欧洲人群,所得结论是否适用于我国前列腺癌患者还需要进一步论证;其次,本研究数据来源于公共数据库,其有效性和可靠性尚需进一步验证;此外,尚需结合多中心的临床数据来进行进一步的论证和预后分析。

猜你喜欢
差异基因前列腺癌生化
前列腺癌复发和转移的治疗
关注前列腺癌
认识前列腺癌
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
从废纸篓里生化出的一节美术课
前列腺癌,这些蛛丝马迹要重视
谁是半生化人
《生化结合治理白蚁》
《生化结合治理白蚁》
紫檀芪处理对酿酒酵母基因组表达变化的影响