基于TCGA数据分析KIF4A基因在恶性胸膜间皮瘤中的表达及预后意义

2024-01-13 03:23李锦松李彬李汉伟刘如爱普元倩自加吉余敏熊伟
右江民族医学院学报 2023年6期
关键词:石棉生存率病理

李锦松,李彬,李汉伟,刘如爱,普元倩,自加吉,余敏,熊伟

(1. 大理大学基础医学院生物化学与分子生物学教研室,云南 大理 671000;2. 云南省昆虫生物医药研发重点实验室,云南 大理 671000;3. 云南省高校临床生物化学检验重点实验室,云南 大理 671000;4. 云南省大理白族自治州第一人民医院,云南 大理 671000;5. 云南大学生命科学学院生物化学与分子生物学实验室,云南 昆明 650091)

恶性胸膜间皮瘤(malignant pleural mesothelioma,MPM)是一种起源于胸膜、极具侵袭性的罕见恶性肿瘤,80%的病例与职业性或环境石棉暴露相关[1]。石棉是一组包含6种不同物化性质的石棉样矿物纤维,主要包括温石棉、青石棉和铁石棉。石棉的吸入可以使机体产生细胞因子和活性氧物质,引起局部炎症反应并最终导致肿瘤的发生[2]。由于20世纪石棉无节制的使用,自1986年首例与石棉相关的恶性间皮瘤在美国被报道以来,间皮瘤的发病率和死亡率一直在上升[3]。间皮瘤是所有癌症类型中生存率最差的癌种之一,5年生存率<10%,中位生存时间<1年。由于间皮瘤有长达40年潜伏期,绝大数间皮瘤患者确诊时已是晚期,且缺乏行之有效的治疗方案,因此迫切需要用于临床早期诊断间皮瘤的筛查方案[4]。

驱动蛋白超家族(kinesin superfamily proteins,KIFs)作为细胞内转运系统的一大组成部分,分为14个亚家族,其中驱动蛋白超家族4(kinesin superfamily protein 4,KIF4)在哺乳动物中枢神经细胞中首次被发现[5]。通过原位杂交发现KIF4有两种亚型,分别为KIF4A和KIF4B,其中KIF4A基因位于10号染色体长臂3区1带,含有31个外显子,编码含有1 232个氨基酸140 kDa大小的KIF4A蛋白。KIF4A蛋白在N-端头部有一个催化结构域,C-端是一个富含半胱氨酸基序的载体结合结构域,N-端和C-端之间则是氨基酸卷曲结构。KIF4A的染色体凝聚、DNA修复和复制功能依赖于其亮氨酸拉链结构和半胱氨酸基序,其维持了基因的稳定性;KIF4A可通过依赖ATP的水解作用沿着微管转运细胞器、蛋白质复合体和mRNA到特定位置;除此之外,KIF4A还参与染色体聚合和解聚、纺锤体组装进而调控细胞有丝分裂和减数分裂[6]。为了探究KIF4A基因表达水平与MPM发生发展的相关性,本研究基于TCGA数据库进行KIF4A基因表达水平与MPM临床病理参数和预后相关性的分析以及在MPM中KIF4A基因与免疫细胞浸润和生存曲线的分析,还通过基因集富集分析(gene set enrichment analysis,GESA)探讨了KIF4A基因相关通路,对于深入了解KIF4A基因在MPM中的作用和机制具有重要意义[7]。

1 资料与方法

1.1在TCGA数据库中下载MPM数据集 在R4.2.3软件中使用cgdsr函数包从TCGA(https://www.cancer.gov/ccg/research/genome-sequencing/tcga)数据库下载MPM数据集,包括KIF4A基因mRNA表达量数据(meso_tcga_pan_can_atlas_2018_rna_seq_v2_mrna)和其患者对应的病理资料(meso_tcga) ,通过TCGA病例ID将对应的两组数据进行合并。将转录组测序数据转换为TPM(transcripts per million mapped reads)格式,进行log2转化数据用于后续分析。

1.2KIF4基因 mRNA表达量与MPM患者临床病理特征相关性分析 通过对TCGA数据库中的87例MPM样本的mRNA二代测序结果进行分析,MPM组织样本中KIF4A基因的表达量为11.53~1485.38,中位数为305.81,以基因表达量中位数为临界值,高于临界值的MPM样本,定义为KIF4A高表达,反之则定义为KIF4A低表达。在MPM数据集中,共含有43例KIF4A基因高表达,44例KIF4A基因低表达。在R4.2.3软件epicalc函数包分析KIF4A基因表达量与临床病理特征之间的相关性。

1.3KIF4A基因在MPM中的临床病理参数可视化 进入UALCAN官网(https://ualcan.path.uab.edu/index.html),选择TCGA模块,输入KIF4A基因,选择Mesothelioma TCGA数据集,并选择expression进行explore,得到KIF4A基因表达水平与不同MPM临床分组关系的箱型图。

1.4KIF4A基因表达水平与MPM患者预后相关性分析 在GEIPA官网(http://gepia.cancer-pku.cn/)内点击survival analysis,在gene栏输入KIF4A,method选择总生存率(overall survival,OS)或无疾病进展生存率(disease free survival,DFS),保持95%置信区间(95% confidence interval,95%CI),最后选择MESO数据库,点击plot作图。

1.5KIF4A基因与MPM免疫浸润相关性分析 通过TIMER官网(http://timer.cistrome.org/),访问TIMER 2.0数据库;分别利用immune association中的gene和outcome功能,设置gene expression为KIF4A,勾选纯度调整,肿瘤类型为MESO,筛选有统计学意义的免疫细胞类型并输出为可视化图表保存。

1.6基因集富集分析 把TCGA数据库MPM样本按照KIF4A基因mRNA表达量的中位数分为高表达组和低表达组,并对两个分组差异分析,根据处理后基因的logFC值从大到小排序,序列上部是上调的差异基因,序列下部是下调的差异基因,进行GSEA分析。计算基因集的富集分数(enrichment score,ES),对基因集的 ES 值显著性检验,估计ES的显著性。最后进行多重假设检验,根据基因集的大小对ES标准化得到标准化后富集分数(normalized enrichment score,NES),随后用 NES 计算假阳性率,从而得到显著富集的基因集。

1.7统计学方法 使用Kaplan-Meier模型和Log-rank检验进行生存分析。从TCGA数据库下载MPM患者的临床病理数据集,并对MPM患者的临床病理资料预处理。运用χ2检验及Fisher精确概率法分析MPM患者临床病理参数。建立COX回归模型对MPM患者临床病理参数进行单因素和多因素分析。P<0.05为差异有统计学意义。

2 结果

2.1MPM患者KIF4A基因mRNA表达水平与临床病理参数的相关性 TCGA数据库中MPM数据集的分析结果表明,KIF4A基因mRNA表达水平与MPM患者年龄、性别、肿瘤分期等无关(P>0.05),而与MPM患者肿瘤类型有关(P<0.05)。见表1。

表1 MPM患者KIF4A基因mRNA表达水平与临床病理参数的关系

2.2KIF4A基因在MPM中的表达模式 UALCAN数据库分析结果表明,KIF4A基因表达量与MPM的肿瘤分期、淋巴结转移状态、TP53基因突变状态等无关;而KIF4A基因表达量与MPM的组织学分型有关,其中KIF4A基因表达量在上皮型MPM中的表达量低于双相型MPM中的表达量(P=0.006)。见图1。

注:A.KIF4A基因在不同间皮瘤分期中的表达情况;B.KIF4A基因在不同间皮瘤亚型中的表达情况;C.KIF4A基因在不同间皮瘤淋巴结转移状态的表达情况;D.KIF4A基因在不同间皮瘤TP53突变状态的表达情况;**P<0.01,ns: no significance。图1 KIF4A基因在MPM组织中的表达情况

2.3KIF4A高表达与患者预后不良有关 总体生存率(OS)分析结果显示,与KIF4A低表达组相比,KIF4A高表达患者生存率随着时间延长呈现下降显著(Log-rankP<0.001)。无疾病进展生存率(DFS)分析结果显示,与KIF4A低表达组相比,KIF4A高表达组生存率也随着时间延长而下降(Log-rankP<0.05)。由此可知,KIF4A基因高表达提示MPM患者预后不良。见图2。

注:A.KIF4A表达量与MPM总体生存率的关系;B.KIF4A表达量与MPM无疾病生存率的关系。图2 KIF4A基因表达量对MPM患者预后的影响

2.4影响MPM患者预后的单因素和多因素分析 对87例MPM患者构建COX临床病理参数回归模型。单因素分析结果显示,KIF4A基因表达量、肿瘤类型与MPM患者预后有关(P<0.05);将KIF4A基因表达量和肿瘤类型纳入多因素回归分析发现:KIF4A基因表达水平与肿瘤类型均是影响MPM患者预后的独立因素(P<0.05),与肉瘤型MPM患者相比,上皮样型的MPM患者预后较好(HR<1.0)。见表2。

表2 影响MPM患者预后的临床病理参数单因素和多因素分析

2.5免疫细胞浸润分析和免疫细胞生存分析 在TIMER 2.0数据库中对87例MPM样本进行KIF4A基因表达量与免疫细胞浸润相关性分析和免疫细胞生存分析。分析结果表明,B淋巴细胞、单核细胞、巨噬细胞、髓样树突状细胞与MPM样本中的KIF4A基因表达量呈正相关。见图3。而CD4+辅助型T细胞、CD4+效应记忆T细胞、血浆B淋巴细胞、单核细胞、巨噬细胞对MPM患者生存时间具有显著影响。见图4。

注:A.B淋巴细胞;B.单核细胞;C.巨噬细胞;D.髓样树突状细胞。图3 KIF4A基因的表达与MPM患者免疫细胞浸润的相关性

2.6基因集富集分析 为探究预后模型中基因的潜在生物学功能,进一步使用GSEA分析来探索预后模型中基因表达相关的富集通路。依据KIF4A基因在TCGA数据集MPM患者中表达量的中位值将样本划分为高表达组和低表达组,使用R软件进行富集分析。结果发现, KIF4A高表达组显著富集于细胞周期、DNA的复制、蛋白酶体、同源重组、真核生物核糖体生物合成、剪接体、mRNA监测途径,核质转运、范可尼贫血通路等通路,提示KIF4A基因的高表达在恶性胸膜间皮瘤中可能起的生物学功能。见图5。

图5 MPM患者中KIF4A基因富集结果

3 讨论

MPM是一种罕见但具有侵袭性的癌症,主要影响受石棉职业暴露的老年人。由于发展中国家癌症登记处覆盖不全,MPM的全球发病率和死亡率尚未可知[8]。暴露于石棉纤维的胸膜间皮细胞容易诱导氧自由基的产生,导致慢性炎症的发展,并在活化巨噬细胞的影响下存活增殖,积累基因突变,最终发生恶性变[9]。虽然MPM是一种主要由职业或环境暴露石棉引起的癌症,但是仅有5%的石棉暴露者会发生MPM。因此,除了石棉暴露这一因素,MPM还与9(9p21)、3(3p21)、22q等染色体重排有关,由此导致一些肿瘤抑制基因如CDKN2A、CDKN2B和NF2基因突变失活[10]。另外,BRCA相关蛋白1(BAP1)基因的种系杂合突变,给予MPM更高的易感性[2]。MPM对于传统的手术切除和放射性治疗反应有限,预后极差,是一种致死性疾病。在晚期不可切除治疗中,培美曲塞和顺铂联合治疗仍是当前唯一许可的一线化疗方案[11]。因此,迫切需要针对MPM的早期诊断和晚期治疗靶点。

KIF4A作为KIF家族蛋白重要一员,在以微管为中心的转运系统中发挥细胞存活、运动、分裂、维持细胞形态等生物学功能。KIF4A在许多癌症中异常表达,在肝细胞癌[12]、肺癌[13]等癌症患者中表达上调;而在胃癌中,KIF4A低表达与肿瘤细胞的不良分化具有显著关系,过表达的KIF4A可抑制体外细胞生长和体内肿瘤形成[14]。由此说明, KIF4A对于不同类型的肿瘤有着截然不同的作用机制。KIF4A可转录抑制Rac1/Cdc42,诱导细胞骨架的重构从而驱动胶质瘤细胞生长[15]。KIF4A在细胞有丝分裂和减数分裂过程中,可诱导细胞非整倍体的出现,进而导致染色体重组或遗传物质异常表达,可导致肿瘤的发生发展[16]。KIF4A还参与肿瘤细胞中的信号通路,其可活化Hedgehog信号通路,抑制结直肠癌细胞的自噬[17];在食管鳞状细胞癌中,KIF4A通过影响Hippo信号通路的磷酸化水平,增强食管鳞状细胞癌的增殖和迁移[18]。除此之外,KIF4A还参与DNA损伤修复、免疫细胞活化、病毒蛋白细胞内交联等肿瘤发生相关活动[12]。研究表明,KIF4A在肺癌[19]、食管鳞状细胞癌[20]、胆管癌[21]、前列腺癌[22]、宫颈癌[23]等多种肿瘤中可作为疾病预测、预后和治疗的靶点。然而,KIF4A在MPM中却少有报道,本文基于TCGA数据库分析KIF4A基因在MPM的表达并作临床病理参数分析和COX单因素和多因素分析,结果提示,KIF4A是影响MPM预后的危险因素,而且影响MPM的组织分型。由此进一步作了KIF4A在MPM中的免疫细胞浸润和免疫细胞生存分析,发现CD4+辅助型T细胞、CD4+效应记忆T细胞、血浆B淋巴细胞、单核细胞、巨噬细胞等免疫细胞浸润水平影响MPM患者的生存状态;此外,通过对KIF4A基因富集分析得出,KIF4A基因参与DNA的复制、同源重组、蛋白酶体、细胞周期、真核生物核糖体生物合成、剪接体、mRNA监测途径,核质转运等通路的生物学功能。HOU G J等[24]在肝癌组织中的GSEA分析结果也同样表明,KIF4A与细胞周期、DNA复制、同源重组通路有关,这与本研究结果一致。另外,p53信号通路在肝癌组织中的KIF4A高表达组显著富集[24]。以上结果提示,KIF4A在MPM中具有潜在的应用价值,其有望作为诊断、治疗或预后靶点改善MPM患者的生存时间和生存状况。

猜你喜欢
石棉生存率病理
病理诊断是精准诊断和治疗的“定海神针”
开展临床病理“一对一”教学培养独立行医的病理医生
“五年生存率”不等于只能活五年
人工智能助力卵巢癌生存率预测
日本首次公布本国居民癌症三年生存率
“五年生存率”≠只能活五年
石棉联社举办农信杯柑甜欢乐拍
不一致性淋巴瘤1例及病理分析
欧洲国家应尽快消除石棉相关疾病
黄芪对兔肺缺血再灌注损伤保护作用的病理观察