NOP56在乳腺癌组织中的表达情况及对临床预后的意义

2019-07-05 11:00林萍萍吕喜英吴练练李青山
生物信息学 2019年2期
关键词:共表达靶向乳腺癌

曲 杰,林萍萍,吕喜英,吴练练,李青山*

(1.河北承德医学院附属医院 肿瘤科,河北 承德 067000;2.武汉大学人民医院 消化内科,武汉 430060)

乳腺癌是女性最常见的恶性肿瘤,发病率逐年升高,严重威胁女性生命健康[1]。NOP56 核糖核蛋白(NOP56 ribonucleoprotein, NOP56)是一种核仁蛋白,是C/D盒小核仁核糖核酸复合物(snoRNPs)的重要组成部分,在60S核糖体亚基组装中发挥关键作用,涉及rRNA前体的早中期加工[2](MIM#614154)。研究报道,NOP56表达受原癌基因c-Myc调控[3],同时,NOP56也可调节c-Myc从而促进Burkitt淋巴瘤生长[4]。NOP56可以与hPygo2蛋白结合,促进人卵巢癌细胞生长[5]。在人乳腺癌细胞中,NOP56基因敲除后细胞集落形成能力和生长能力明显降低[6]。然而,NOP56在人乳腺癌组织中的表达情况及临床意义的大数据分析尚未见报道。

通过对美国生物技术信息中心(National Center for Biotechnology Information,NCBI)的基因表达综合数据库(Gene Expression Omnibus,GEO)[7]和美国国立健康中心(The National Institude of Health,NIH)的癌症基因图集数据库(The Cancer Genome Atlas,TCGA)[8]公共数据集进行分析,探索NOP56在人乳腺癌组织中的表达及临床病理关系,同时在K-M plotter 在线数据库中研究NOP56的预后价值。进一步利用String、GSEA数据库,挖掘乳腺癌中与NOP56存在互相作用的蛋白网络,筛选与NOP56存在相互作用的基因并建立基因调控网络,WebGestalt数据库寻找靶向药物[9],为乳腺癌的分子机制研究提供新的切入点和同时进一步探讨临床靶向药物治疗的分子机制。

1 材料与方法

1.1 数据资料收集

从NCBI的GEO数据库下载原始数据,通过MAS5进行标准化,乳腺癌组织登录号为GSE42568、GSE15852、GSE10780和GSE45255。从TCGA数据库下载原始数据,通过RSEM标准化。纳入的数据基本信息见表1。

表1 纳入的4套乳腺癌基因芯片基本信息Table 1 Basic information of four GEO datasets of breast cancer

1.2 差异表达基因分析

在数据集GSE15852中,通过配对样本T检验比较乳腺癌和配对癌旁组织NOP56表达差异。在数据集GSE42568和GSE10780中,通过非配对样本T检验比较乳腺癌和正常组织NOP56表达差异;在TCGA数据库中,通过非配对样本T检验比较不同临床病理分期的乳腺癌和配对癌旁组织NOP56表达差异;在TCGA数据库中,通过非配对样本T检验比较不同临床病理分期乳腺癌组织和配对癌旁组织NOP56表达差异。

1.3 数据集筛选与临床病理学参数相关性研究

TCGA数据集和GSE45255基因样本量大且附带临床信息,利用此数据集进行进一步的相关性研究。其中临床资料缺失的样本被排除,根据表达谱数据,对样本的NOP56表达进行由高到低排序,高于信号log2中位数的样本作为高表达组,低于信号log2中位数的样本作为低表达组。

1.4 Kaplan-Meier plotter在线数据库分析

利用在线数据库Kaplan-Meier plotter (http://www. kmplot.com/breast) 获得的3 951例乳腺癌患者信息,以NOP56表达中位值(Median) 将样本分为低表达和高表达组,利用缺省设置,在线分析NOP56对乳腺癌患者总生存期和无病生存期的预后价值。

1.5 NOP56互相作用基因筛选和功能富集分析

利用String(https://string-db.org)在线数据库筛选人乳腺癌样本中与NOP56存在互作关系的蛋白质并且获得互作蛋白网络图。通过R3.5软件计算互作基因在分子功能、生物过程、细胞组分以及三者平均的语义相似性并绘制热图。利用GSEA3.0软件对上述互作基因进行富集分析。

1.6 靶向药物富集分析

利用WebGestalt(http://www.webgestalt.org)在线数据库富集分析互作基因的靶向药物。

1.7 采用SPSS 20.0软件进行统计学分析

生存分析采用Kaplan-Meier和log-rank检验法。临床病理参数相关性分析,组间比较采用χ2检验及Fisher 确切概率法。以P< 0. 05 为差异有统计学意义。筛选共表达基因采用spearman和Pearson检验,spearman分数和 Pearson分数均大于0.3的基因被认为有共表达关系。功能分析采用Fisher精确检验,P<0.05的功能集合被认为差异有统计学意义。

2 结果分析

2.1 NOP56在人乳腺癌组织中高表达

在GEO数据库的3个独立数据集GSE42568、GSE15852和GSE10780中,与正常组织相比,NOP56在人乳腺癌组织中显著高表达。在TCGA数据库的数据集中,1 093例乳腺癌组织与112例正常组织相比,NOP56在人乳腺癌组织中显著高表达(见图1);不同临床病理分期的乳腺癌组织与正常组织相比,NOP56均高表达(P< 0.001)(见表2)。

图1 NOP56在人乳腺癌组织中高表达Fig.1 Overexpressed NOP56 in human breast cancer

数据来源分期P值TCGAStage I<0.001Stage II<0.001Stage III<0.001Stage IV<0.001

2.2 NOP56高表达与患者不良临床病理参数相关

2.2.1 分析GSE45255 数据集中年龄、淋巴结转移、雌激素受体(ER)状态、孕激素受体

(PRG)状态、人表皮生长因子受体2(HER2)状态、组织学分级和肿瘤大小等临床病理参数与NOP56表达高低的相关性。结果显示,NOP56 高表

达在组织学分级为G3的肿瘤样本中更常见,而在分化程度较高的G1、G2肿瘤样本中,NOP56低表达更多见(P< 0.001),提示NOP56高表达与乳腺癌的进展呈正相关。同时,NOP56与乳腺癌HER2状态相关,在HER2状态阳性的患者中高表达(P=0.019) 。NOP56的表达与年龄、淋巴结转移、PRG状态、ER状态和肿瘤大小无显著相关性(见表3)。

2.2.2 分析TCGA 数据集中年龄、淋巴结转移、雌激素受体(ER)状态、孕激素受体

(PRG)状态、人表皮生长因子受体2(HER2)状态和病理分期等临床病理参数与NOP56表达高低的相关性。结果显示, NOP56与乳腺癌HER2状态、年龄、PRG状态相关,在HER2状态阳性的患者中高表达( P=0.019) ,在年龄< 55岁的患者中高表达(P<0.001),在PRG阴性的患者中高表达(P<0.000 1)。NOP56的表达与年龄、淋巴结转移和ER状态无显著相关性(见表4)。GEO数据库与TCGA数据库结果一致。

2.3 NOP56高表达提示不良预后

K-M plotter生存分析显示,NOP56高表达患者的无进展存活期(Disease free survival,DFS)和总存活期(Overall survival,OS)均明显较低表达患者短(P< 0.001,见图2)。这表明NOP56低表达与患者生存期缩短显著相关,NOP56可能成为预测乳腺癌的预后指标(见图2)。

表3 不同NOP56表达与GEO数据库139例乳腺癌患者临床病理参数的关系Table 3 Correlation between NOP56 expression and clinicopathological parameters in 139 patients with breast cancer

表4 不同NOP56表达与数据TCGA数据库库1 093例乳腺癌患者临床病理参数的关系Table 4 Correlation between NOP56 expression and clinicopathological parameters in 1 093 patients with breast cancer in TCGA

图2 NOP56表达水平与乳腺癌患者生存时间关系Fig.2 Correlation between NOP56 expression and the prognosis of breast cancer patients

2.4 NOP56互作及其功能

String在线数据库筛选人乳腺癌样本中与 NOP56存在互作关系较强的基因10个。(见图3(a)) R3.5进行语义相似性分析(见图3(b)、(c)、(d)、(e))

图3 NOP56蛋白互作网络以及共表达基因与NOP56分子功能、生物过程、细胞组分以及平均语义相似性Fig.3 Gene interaction network diagram of NOP56 and the molecular function,biological process,cellular component,and the mean semantic similarity between NOP56 and its co-expressed genes

利用GSEA数据库对互作基因进行富集分析,结果显示这些基因主要富集在RNA加工,细胞分裂和DNA复制等与肿瘤发生发展关系密切的功能上(见图4)。

图4 NOP56共表达基因主要富集在RNA加工和细胞分裂等与肿瘤发生发展关系密切的功能上Fig.4 NOP56 co-expression genes are mainly enriched in the functions closely related to the tumor development such as RNA processing and cell division

2.5 NOP56互作基因靶向药物

WebGestalt网站分析显示,以上互作基因靶向药物有5种,其中互作基因作为靶基因最多的为放线菌素D(见表5)

表5 靶向基因药物Table 5 Targeted gene drugs

3 讨 论

乳腺癌的发生发展离不开异常的蛋白质生物合成[6],而细胞中蛋白质的合成需求与核糖体生物合成活性相协调,当某些关键的核糖体蛋白水平上调后,可通过调节其他蛋白的表达影响细胞生长代谢[10]。研究表明,核糖体生物合成速率增加促进原癌基因Myc表达,增加癌细胞增殖能力[8],同时可通过释放MDM2蛋白降解抑癌基因p53[12]和pRb[13],增加癌症患病风险。核糖体生物合成活跃可促进乳腺癌细胞侵袭能力,增加乳腺癌恶性程度[14]。NOP56是小分子核仁核糖核蛋白(snoRNP)复合体的核心蛋白质成员,直接对rRNA前体核糖部分进行甲基化修饰,在核糖体生物合成中发挥重要作用[15]。NOP56突变可导致60S核糖体亚基装配缺陷,rRNA加工受抑[15]。研究表明,NOP56可调节原癌基因c-Myc促进Burkitt淋巴瘤细胞生长[4],同时可以与hPygo2蛋白结合,促进卵巢癌细胞生长[5]。本研究通过生物信息学分析,首次在人乳腺癌组织中发现NOP56显著高表达,且NOP56高表达与乳腺癌不良临床病理参数和预后相关。为进一步揭示其作用机制,我们探索了乳腺癌中NOP56共表达基因、互作蛋白及其功能,并构建蛋白互作网络图。

通过GEO和TCGA数据库,我们首次发现NOP56在人乳腺癌中显著高表达。在GSE45255中,数据显示NOP56高表达患者乳腺癌分化程度低。这与已有的研究一致,Su H等人发现NOP56促进人乳腺癌细胞集落形成能力和生长能力[6]。此外,我们发现NOP56在HER2阳性患者中高表达。HER2过表达与乳腺癌的发生、发展、侵袭和转移密切相关[16]。HER2基因编码酪氨酸激酶活性跨膜糖蛋白,与相应配体结合导致胞内酪氨酸激酶磷酸化,引起细胞生长、增殖相关信号通路如NF-κB等的连锁反应,促进细胞增殖分化[17]。HER2阳性乳腺癌细胞c-Myc表达水平高,敲低HER2基因后c-Myc表达降低[18],而c-Myc可直接促进NOP56表达[3]。这说明乳腺癌中HER2可能通过激活细胞生长增殖相关信号通路上调c-Myc等原癌基因从而促进NOP56表达。我们进一步利用在线数据库K-M plotter,对3 951例乳腺癌患者进行预后分析,发现NOP56高表达乳腺癌患者生存期显著降低。乳腺癌组织中NOP56表达水平,或许可以作为乳腺癌患者新的检测指标和远期预后评价指标,但还需大样本的临床数据进一步验证。

为了进一步理解乳腺癌中NOP56异常表达的机制,筛选出NOP56最显著的互作基因10个。单一的基因异常往往伴随下游基因的连锁异常反应,这是多种癌症相关基因异常促进癌症发展的重要原因之一。功能分析显示,NOP56共表达基因主要参与RNA加工,细胞分裂和DNA复制等与肿瘤发生发展关系密切的功能。这些结果与现有的实验结果一致,Victoria H.等[5]发现NOP56 基因过表达后,Burkitt淋巴瘤细胞的增殖明显加快;Yuichi J.等[19]发现在乳腺癌上皮细胞中Nop56促进细胞周期G1期缩短,是细胞周期进程的重要介质。研究证明NOP56共表达网络的准确性,提示NOP56可能通过影响这些共表达基因来发挥其促癌作用。

最后,我们筛选出了NOP56互作基因富集的靶向药物,选取了富集基因最多的放线菌素类中的放线菌素D。放线菌素D(更生霉素)是第一种显示出具有抗肿瘤活性的抗生素,是临床上广泛使用的抗肿瘤药物,现在常用于各种小儿肿瘤,如肾母细胞瘤,横纹肌肉瘤和尤因氏肉瘤的治疗[20-22]。放线菌素D是一种DNA嵌入剂,它更偏向于富含GC的DNA序列[ 23 ]。Perry RP等人发现低浓度的放线菌素D可以破坏核糖体正常的生物过程,最终导致细胞周期停滞和细胞凋亡[ 23-25]。Das T等人研究发现放线菌素D可以下调SOX2表达,从而诱导乳腺癌干细胞死亡[26]。通过这些研究我们可以假设,放线菌素D通过靶向作用于NOP56以及其互作基因达到对乳腺癌的治疗作用,放线菌素D的治疗作用可能与NOP56的表达量相关,而这些假设还需要进一步的实验以及临床验证。

综上所述,利用公共数据库证明乳腺癌组织中NOP56高表达,NOP56促进肿瘤分化,在HER阳性患者中表达量高,且与乳腺癌患者的不良预后密切相关。机制上,我们研究了乳腺癌中NOP56共表达基因,其功能主要为RNA加工,细胞分裂和DNA复制等与肿瘤发生发展关系密切的功能,并构建基因互作网络图,发现互作基因靶向药物明显富集在放线菌素D上。系统地研究了NOP56在乳腺癌中的表达与临床预后、临床病理状态以及组织学分级的关系,探讨了分子机制以及与临床靶向药物的关系,为乳腺癌防治提供潜在的新的预测指标,完善了临床靶向药物使用的分子机制。

猜你喜欢
共表达靶向乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
新型抗肿瘤药物:靶向药物
如何判断靶向治疗耐药
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
靶向治疗 精准施治 为“危改”开“良方”
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
中国流行株HIV-1gag-gp120与IL-2/IL-6共表达核酸疫苗质粒的构建和实验免疫研究