基于整合药理学和转录组学的肝细胞癌和胆管癌共同差异miRNA调控网络构建及相关中药预测分析Δ

2024-03-08 03:45施金虎蓝晓红王玥坤易剑峰
中国医院用药评价与分析 2024年2期
关键词:靶点关键调控

施金虎,吴 波,蓝晓红,王玥坤,杨 阳,易剑峰,魏 玮,高 茗#

(1.中国人民解放军东部战区总医院药剂科,南京 210002; 2.江西中医药大学中医基础理论分化发展研究中心,南昌 330004)

原发性肝癌的发病率在我国常见恶性肿瘤疾病中居第4位,其病死率在恶性肿瘤中居第2位,严重威胁我国人民的生命和健康[1]。原发性肝癌主要分为肝细胞癌(HCC)、肝内胆管癌(ICC)和混合型肝细胞癌-胆管癌(Chcc-CCA)3种不同病理学类型,三者发病机制、病理组织学、治疗方法、生物学行为以及预后等方面差异较大,既往研究主要在HCC或胆管癌(CC)方面,而2种疾病的共同基础分子机制鲜有报道。因此,研究两者间的联系,有助于肝胆癌早期筛查、诊断、系统治疗及随访监测等。随着高通量测序技术的不断发展与完善,基于多组学数据研究被用于挖掘调控疾病潜在细胞因子、基因表达异常及信号通路等复杂调控机制。微RNA(miRNA)是一类内源性的具有调控功能的非编码RNA分子,广泛分布于真核生物中,其大小长20~25个核苷酸。近年来,大量研究发现miRNA及其靶基因的表达失调,影响多种肿瘤细胞增殖、侵袭及凋亡,已成为当今研究的热点。随着转录组学的高速发展,使得研究人员对特定癌种中表达失衡miRNA及其调控靶点挖掘变为可能。本研究通过挖掘HCC和CC中共同差异表达miRNAs(DEMs),预测其上游调控基因和下游调控靶点,借助Cytoscape 3.9.1软件筛选关键靶点,构建miRNA-关键靶点调控网络,并对关键靶基因进行验证和中药预测分析,以期为肝胆癌的诊断和治疗提供新的线索或依据。

1 资料与方法

1.1 转录组数据获取

本研究所需芯片数据集源于GEO数据库(https://www.ncbi.nlm.nih.gov/geo/),该数据库储存了大量转录组基因表达数据集和测序序列。在GEO DataSets搜索栏添加“hepatocellular carcinoma and cholangiocarcinoma and miRNA or microRNA”进行检索,获得与研究内容相关的芯片数据集。

1.2 DEMs、上游转录挖掘因子及下游靶基因挖掘

HCC和CC基因表达原始数据均来自GSE209875数据集,该数据来自日本东丽工业株式会社,包含了10对HCC患者(6对CC患者)肿瘤组织和癌旁组织(基因芯片平台:GPL21185和GPL21263)。利用在线分析工具GEO2R对数据集进行分组,以阈值为|log2FC|>1和P<0.05[2]筛选DEMs,通过FunRich数据库(http://www.funrich.org/)预测上游转录因子[3],通过miRNet数据库(https://www.mirnet.ca/)预测下游靶基因。

1.3 蛋白质-蛋白质相互作用(PPI)网络、miRNA调控网络构建及关键基因筛选

将“1.2”中预测的下游靶基因上传至STRING数据库(https://cn.string-db.org/),阈值“minimum required interaction score=0.4”“hide protein names”,获得PPI网络。随后,用Cytoscape 3.9.1软件行可视化处理,并用“cytohubba”插件行MCC算法分析,得到该网络关键靶基因,按打分值排序,选取前30位靶基因与DEMs构建miRNA调控网络。

1.4 下游靶基因功能富集分析

将“1.2”中预测下游靶基因上传至DAVID数据库(https://david.ncifcrf.gov/),获得靶基因参与生物过程(BP)、细胞组成(CC)和分子功能(MF)及KEGG通路。

1.5 关键基因在癌组织和非癌组织中的表达差异及对整体生存率的影响

UALCAN数据库(http://ualcan.path.uab.edu/)是综合交互式的网络数据库,可用于识别生物标志物或潜在基因,便于研究人员收集有价值基因信息和数据。将关键基因上传至UALCAN数据库,选择“TCGA”功能模块,获取靶基因在正常人与HCC(或CC)患者中的表达差异,P<0.05为差异有统计学意义[4]。Kaplan Meier-plotter软件(https://kmplot.com/analysis/)能够评估所有基因表达与21种肿瘤类型的样本存活率之间的相关性,该软件用于恶性肿瘤相关生物标志物研究。将关键基因上传至该软件,选择“liver cancer”进行分析,获得靶基因整体生存率。

1.6 关键靶点相关中药预测

与靶点相关的中药预测用到的数据库为Coremine Medical(https://www.coremine.com/),该数据由多国科研机构共同研制,吸纳中西医相关领域的医学信息检索平台,支持在线检索与靶点相关的信息,如中药、疾病、药物、食物、基因、蛋白、化合物及细胞成分等。将关键基因映射到Coremine Medical数据库中获取相关中药,P<0.05为差异有统计学意义。

2 结果

2.1 实验样本信息

基于GSE209875基因片段原始数据,对其进行分组:HCC组包括10个恶性肿瘤组织和10癌旁组织,年龄为62~75岁,平均68岁,样本的miRNA来源于total RNA;CC组包括6个恶性肿瘤组织和6个癌旁组织,年龄为63~76岁,平均71岁,样本的miRNA来源于total RNA。

2.2 DEMs、上游调控因子及下游调控靶点的预测

通过在线分析工具GEO2R对两组进行差异分析,分别得到14个DEMs(HCC组)和104个DEMs(CC组),其中miR-199a-5p为两组共同DEMs,见图1(A)—图1(B)。利用FunRich软件对miR-199a-5p进行转录因子预测,得到28个转录因子,差异最大的前6个分别为EGR1、ELF1、MEF2A、POU2F1、SP1和RXRA,见图1(C);通过miRNet数据库预测出166个下游靶基因,见图1(D)。

A.HCC组与CC组DEMs交集;B.CC组和HCC组miR-199a-5p热图;C.miR-199a-5p上游转录因子;D.miR-199a-5p下游调控靶点。

2.3 miRNA-hubGenes调控网络构建

将166个下游靶基因映射到STRING数据库中,构建PPI网络,该网络中有166个节点,449条边,平均度值为5.41,PPI enrichment(P<1×10-16),见图2(A)。利用Cytoscape 3.9.1软件中“cytohubba”插件分析该网络关键靶点,选取分值排序前30位进行可视化处理,见图2(B)、表1。将关键基因映射至下游靶基因网络,见图2(C)。

表1 MCC算法关键基因打分排序(前10位)

2.4 差异miRNA的KEGG通路富集分析与GO功能富集分析

BP富集到270个条目,68个有效条目,主要涉及基因表达的正向调控、凋亡过程的负调控、细胞增殖的正向调节、蛋白质磷酸化、对缺氧的反应、上皮细胞向间质细胞转变和细胞迁移的正向调节等;CC富集到41个条目,11个有效条目,主要涉及基底外侧质膜、细胞质、转录因子复合物、细胞表面和核内膜等;MF富集到49个条目,28个有效条目,主要涉及蛋白激酶结合、酶结合、生长因子结合、蛋白激酶活性、受体结合、细胞因子活性和胶原蛋白绑定等,见图3(A)。KEGG通路主要富集到癌症通路、胃癌、胰腺癌、FoxO信号通路、HCC、丝裂原激活的蛋白激酶(MAPK)信号通路以及磷脂酰肌醇3激酶-蛋白激酶B(PI3K-Akt)信号通路等,见图3(B)。

A.PPI网络;B.MCC算法分析关键基因间相关性;C.miRNA与关键基因调控网络,绿色倒三角示下调miR-199a-5p,红色菱形示打分值排序居前10位的上调关键基因,红色圆形为打分较低关键基因。

A.下游靶基因主要参与生物过程、组成成分及分子功能;B.下游靶基因富集到的主要信号通路。

2.5 关键基因在恶性肿瘤组织及正常组织中的表达差异

本课题组研究了TCGA数据集中关键基因在正常人与恶性肿瘤患者中的表达水平,发现HCC及CC的VEGFA、CDH1、CD44、SMAD4、SMAD3、CDH2、SOX9、JAG1和KRAS等9个关键基因mRNA表达与正常人比较有显著性差异,见图4(A)—图4(T)。进一步比较其差异的变化趋势,发现VEGFA、CD44、SMAD4、SMAD3、SOX9、JAG1和KRAS等7个关键基因在HCC和CC中的表达较正常组织显著升高,与上述预测结果一致。CDH1基因在HCC中表达较正常组织显著升高,在CC中表达较正常组织显著降低,说明该基因在不同癌种间发挥着不同生物学作用。

2.6 Kaplan Meier-plotter生存曲线分析

通过对关键基因(排序居前10位)进行HCC患者整体生存率的分析,发现VEGFA、CDH1、SOX9和JAG1的异常表达与HCC患者整体生存率有关,见图5。

A—J.不同表达的关键基因对肝癌患者整体生存率的影响(logrank P<0.05为差异有统计学意义)。

A.预测中药性味分类;B.预测中药归经。

2.7 相关中药预测结果

将关键基因(排序居前10位)映射至Coremine Medical数据库,筛选治疗HCC或CC的潜在中药,共筛选出中药25味(P<0.05),结果见表2。对预测的中药进行性味、归经分析,多数中药以微寒为主,主要归于肝经、脾经,见图6。

表2 与关键基因作用的潜在中药

3 讨论

目前,甲胎蛋白被广泛作为HCC诊断的生物标志物,但由于HCC发生、发展的生物学过程十分复杂,且易受外界因素的影响(如病毒性肝炎、乙醇),因而,寻找新的HCC预后相关分子标志物对HCC的诊断、治疗及预后意义重大[5]。CC是常见的肝脏恶性肿瘤,具有恶性程度高、扩散转移时间短、治疗效果差和生存期短等特点。上述2种疾病虽病理机制不同,但仍有交集,若能探明其内在联系,有利于疾病诊疗。随着生物数据量剧增和生物信息学快速发展,与肿瘤相关的二级数据库逐渐趋于完善,研究人员可对特定癌种中表达异常基因进行系统研究[6-8]。

本研究从GEO数据库中获取HCC和CC芯片数据集,利用在线分析工具GEO2R对两组数据集进行差异表达分析,HCC数据集共筛选出14个miRNA,CC数据集共筛选出104个miRNA,两者共同DEMs为miR-199a-5p。为进一步深入研究其调控机制,进而预测分析共同DEMs的上游转录基因,得到EGR1、ELF1、MEF2A、POU2F1、SP1和RXRA等6个上游转录基因;下游靶标预测出166个靶基因。随后进行生物学过程和通路富集,靶基因主要参与增加基因表达调节、抑制凋亡过程、促进细胞增殖、上皮细胞向间质细胞转变和促进细胞迁移等生物过程;主要涉及癌症通路、FoxO信号通路、MAPK信号通路以及PI3K-Akt信号通路;富集到主要疾病包括胃癌、胰腺癌和HCC。PPI网络筛选出VEGFA、CDH1、CD44和SMAD4等10个关键基因。VEGFA是血小板衍生生长因子/血管内皮生长因子家族的成员,可介导并增加血管通透性,诱导血管生成,血管发生和内皮细胞生长,促进细胞迁移和抑制细胞凋亡[9-11]。CDH1为钙依赖性细胞黏附蛋白,属于钙黏蛋白家族成员,CDH1基因参与细胞黏附、迁移和上皮细胞增殖,与肿瘤发生、发展密切相关[12]。CD44基因编码细胞表面糖蛋白,参与细胞间相互作用、细胞黏附和迁移,现已证实该蛋白质在肿瘤细胞侵袭、转移中起促进作用。SMAD4属于Smad家族成员,可充当肿瘤抑制因子并抑制上皮细胞增殖,还可通过减少血管生成和增加血管通透性而对肿瘤产生抑制[13]。SNAI1是蛋白质编码基因,主要参与上皮间质转化的诱导以及胚胎中胚层的形成和维持、生长停滞、存活和细胞迁移[14]。研究结果显示,上述基因可能参与HCC/CC相关的肿瘤发生、发展不同阶段,有相应文献为支撑。因而,本预测具有一定的参考意义。

为验证研究结果的可行性,本课题组比较了核心基因在正常人与HCC(或CC)患者中的表达差异及影响肝癌预后分析。发现VEGFA、CD44、SMAD4、SMAD3、SOX9、JAG1和KRAS等7个关键基因在HCC和CC中的表达较正常组织显著升高,与上述预测结果一致。且VEGFA、CDH1、SOX9和JAG1的异常表达与肝癌患者整体生存率显著相关。本研究发现,miR-199a-5p表达相比癌旁组织显著下调,而miR-199a-5p的低表达可以通过增加VEGFA、CDH1、SOX9和JAG1等基因表达来促进肝胆肿瘤细胞增殖、侵袭能力,后续可进行相关实验验证。此外,本课题组通过COREMINE数据库对干预关键靶点进行相关中药预测,结果提示丹参、当归和人参出现频次较多,药物归经以肝、脾两经为主,且多为微寒类。中医学无“HCC”病名,临床表现多以肋间痛、腹水、黄疸及腹内包块,中医学将其归属于“肝积”“脾积”和“癖黄”等范畴[15-16]。中医学中,CC可归于“肋痛”“黄疸”范畴,与气血凝结、七情内伤、腑脏亏损和饮食劳伤等密切相关[17],可见2种疾病间交集存在。文献报道,丹参可抑制肝癌细胞生长、诱导恶性肿瘤细胞分化,减轻患者症状,缩小癌肿,增强抗肿瘤药物疗效,并降低门静脉高压等[18-21]。张谊等[22]研究发现,丹参酮ⅡA能够剂量依赖性地抑制肝癌细胞HepG2增殖,诱导细胞凋亡、ATP生成减少、耗氧量降低以及线粒体膜电位的下降。罗艺[23]发现,丹参中的隐丹参酮通过调控PI3K-AKT-雷帕霉素靶蛋白信号通路诱导肝癌细胞凋亡和自噬,体内实验表明隐丹参酮能够抑制肝癌细胞Huh7裸鼠皮下移植瘤的生长。

本研究的局限之处在于数据来源依赖于GEO数据库中记载的芯片数据集,然而单一来源芯片数量过少,可能对研究结果造成偏倚。因而,本课题组采用多个数据库结合文献报道验证结果的准确性,为后续实验研究进行铺垫。总之,本研究构建了miRNA与关键基因调控网络,分析关键基因在2种恶性肿瘤中的差异表达及预后不利因素,上述结果有望为肝胆癌发病机制和临床治疗提供新的线索。

猜你喜欢
靶点关键调控
硝酸甘油,用对是关键
维生素D受体或是糖尿病治疗的新靶点
高考考好是关键
肿瘤免疫治疗发现新潜在靶点
如何调控困意
经济稳中有进 调控托而不举
顺势而导 灵活调控
SUMO修饰在细胞凋亡中的调控作用
心力衰竭的分子重构机制及其潜在的治疗靶点
氯胺酮依赖脑内作用靶点的可视化研究