LncRNA H19基因多态性与乳腺癌遗传易感性关联的Meta分析

2021-07-01 03:16李晓波白素琴张清雯
国际检验医学杂志 2021年12期
关键词:基因型位点异质性

李晓波,李 婷,白素琴,张清雯

西安交通大学医学院附属3201医院:1.微生物免疫检验科分子诊断实验室;2.临床医学检验科,陕西汉中 723000

乳腺癌是发生在乳腺上皮组织的恶性肿瘤,约占女性侵袭性肿瘤的22.9%[1]。国际癌症研究机构(IARC)预测,预计到2040年,全球乳腺癌诊断病例将达300万左右[2]。近年来,我国乳腺癌患病率增长迅速,其中年轻人患病率比老年人患病率增长速度更快[3-4]。GAGE等[5]研究发现,5%~10%的乳腺癌患者发病与遗传因素相关。随着乳腺癌家族中患者数量的增加,其家族新生儿的乳腺癌患病风险随之增加,并且病死率与家族中患病人数呈正相关[6]。乳腺癌发病机制复杂,具体尚不明确,目前普遍认为其发病是基因突变和环境风险因素共同决定的[7-8]。长链非编码RNA(LncRNA)是一组长度超过200个碱基,不能翻译成蛋白质的非编码RNA,其在细胞增殖、细胞周期调控、细胞分化调控、应激反应等多种生物学过程中发挥着重要作用,与肿瘤的发生密切相关[9-11]。LncRNA H19基因位于11号染色体短臂上(11p15.5),长度为2.3 kb,其基因过表达与多种肿瘤的进展有关[12-13]。单核苷酸多态性(SNP)作为最常见的遗传变异,在肿瘤研究中越来越受到重视[14]。SNP被发现能够预测肿瘤的发生风险和预后[15-16]。近期研究发现,LncRNA H19基因rs217727和rs2839698 SNP位点是乳腺癌的易感基因位点[17-21],但上述位点与乳腺癌的相关性在不同人种、不同地区间存在较大差异。因此,本文对LncRNA H19基因rs217727和rs2839698 SNP位点与乳腺癌遗传易感性之间的关系进行了Meta分析。

1 资料与方法

1.1文献检索策略 在英文数据库PubMed、Embase、Elsevier中检索关键词“breast cancer or carcinoma or tumor”“H19 or LncRNA H19 or Long noncoding RNA H19”“Polymorphism or SNP”“rs217727”“rs2839698”;在中文数据库维普(VIP)、中国知网(CNKI)、万方数据库中检索关键词“乳腺癌”“单核苷酸多态性”“H19或LncRNA H19或Long noncoding RNA H19” “rs217727”“rs2839698”。数据库检索时间截至2020年4月,语种包括英文和中文。

1.2文献纳入和排除标准 纳入标准:(1)研究类型为病例对照研究,且病例组为乳腺癌患者,对照组为健康对照者;(2)研究中包括了rs217727 C>T和rs2839698 C>T SNP位点,并且有基因型分类数据。排除标准:(1)重复发表或者数据不完整;(2)研究未设立对照组;(3)会议讨论、综述及 Meta分析类文献;(4)基因型频率不符合哈迪-温伯格平衡定律。

1.3纳入研究数据的提取 所有数据由2名研究人员独立提取,提取数据包括第一作者、文献发表时间、研究人群、对照组来源、基因分型方法、病例组与对照组的年龄与例数,以及rs217727和rs2839698 SNP位点基因型分布情况。如研究包含多种人群,应对不同人群数据分别抽提分类后再进行分析。

1.4文献质量评价 根据Cochrane协作网推荐的纽卡斯尔-渥太华量表(NOS)对所有文献进行质量评价。NOS评分标准由人群选择、病例组和对照组的可比性、暴露因素的测量3部分组成,包括8个项目,总分为9分。NOS评分在0~4分为低质量研究文献,将5~9分的高质量研究文献纳入本研究。

1.5统计学处理 Meta分析使用STATA12.0软件Meta-analysis模块。分析LncRNA H19基因rs217727和rs2839698 SNP位点与乳腺癌发生风险的关系,统计比值比(OR)和95%置信区间(95%CI),OR值采用Z检验计算。样本异质性分析采用Q检验,以P≤0.10为存在显著异质性,分析选择随机效应模型;以P>0.10为效应量分布异质性不显著,分析选择固定效应模型。发表偏倚分析采用Begg′s检验。采用SPSS20.0软件中的χ2检验进行哈迪-温伯格平衡定律验证。

2 结 果

2.1文献检索流程及纳入文献的基本特征 初步检索获得LncRNA H19基因多态性与乳腺癌遗传易感性的相关文献141篇,通过剔除无关文献、Meta分析、综述及会议讨论130篇,筛选出11篇文献;进一步阅读全文剔除无对照组和数据不全的文献6篇,最终保留5篇病例对照研究。关于rs217727 SNP位点的有5篇,共纳入研究对象6 570例,其中乳腺癌患者3 178例,健康对照者3 392例;关于rs2839698 SNP位点的有3篇,共纳入研究对象5 434例,其中乳腺癌患者2 607例,健康对照者2 827例。纳入研究文献中rs2839698、rs217727 SNP位点的基因型频率均符合哈迪-温伯格平衡定律(P>0.05)。纳入研究文献的基本特征及LncRNA H19基因rs217727、rs2839698 SNP位点基因型分布分别见表1、2。纳入研究的5篇文献使用NOS进行质量评价,评分均≥5分,属于高质量文献,见表3。

表1 纳入研究文献的基本特征

表2 LncRNA H19基因rs217727、rs2839698 SNP位点基因型分布

表3 纳入研究文献的质量评价(分)

2.2Meta分析结果

2.2.1rs217727 SNP位点与乳腺癌遗传易感性的关联 纳入Meta分析的5篇关于rs217727 SNP位点的文献中,等位基因(Tvs.C)异质性检验显示,I2=84.0%,P<0.001,存在显著异质性,采用随机效应模型分析,病例组与对照组等位基因T、C比较,差异无统计学意义(Z<0.01,OR=1.000,95%CI:0.799~1.251,P=0.999)。加性模式(TTvs.CC)异质性检验显示,I2=71.1%,P=0.097,存在显著异质性,采用随机效应模型分析,病例组与对照组TT、CC基因型比较,差异无统计学意义(Z=0.30,OR=1.059,95%CI:0.728~1.541,P=0.765)。隐性模式(TTvs.CT+CC)异质性检验显示,I2=82.6%,P=0.077,存在显著异质性,采用随机效应模型分析,病例组与对照组TT、CT+CC基因型比较,差异无统计学意义(Z=0.42,OR=0.939,95%CI:0.703~1.255,P=0.671)。显性模式(TT+CTvs.CC)异质性检验显示,I2=69.8%,P=0.076,存在显著异质性,采用随机效应模型分析,病例组与对照组TT+CT、CC基因型比较差异无统计学意义(Z=0.72,OR=1.131,95%CI:0.808~1.583,P=0.472)。人群分层研究显示,中国汉族人群和伊朗人群rs217727 SNP位点4种遗传学模式在病例组与对照组间比较,差异均无统计学意义(P>0.05)。见表4。

表4 基因多态性与乳腺癌遗传易感性的Meta分析结果

2.2.2rs2839698 SNP位点与乳腺癌遗传易感性的关联 纳入Meta分析的3篇关于rs2839698 SNP位点的文献中,等位基因(Tvs.C)异质性检验显示,I2=91.6%,P<0.001,存在显著异质性,采用随机效应模型分析,病例组与对照组等位基因T、C比较,差异无统计学意义(Z=1.56,OR=1.299,95%CI:0.935~1.804,P=0.119)。加性模式(TTvs.CC)异质性检验显示,I2=89.3%,P=0.289,效应量分布异质性不显著,采用固定效应模型分析,病例组与对照组TT、CC基因型比较,差异无统计学意义(Z=1.60,OR=1.718,95%CI:0.884~3.339,P=0.111)。隐性模式(TTvs.CT+CC)异质性检验显示,I2=90.7%,P=0.118,效应量分布异质性不显著,采用固定效应模型分析,病例组与对照组TT、CT+CC基因型比较,差异无统计学意义(Z=1.51,OR=1.395,95%CI:0.905~2.149,P=0.131)。显性模式(TT+CTvs.CC)异质性检验显示,I2=74.1%,P=0.085,存在显著异质性,采用随机效应模型分析,病例组与对照组TT+CT、CC基因型比较,差异无统计学意义(Z=1.43,OR=1.334,95%CI:0.900~1.978,P=0.151)。人群分层研究显示,中国汉族人群4种遗传学模式在病例组与对照组间比较,差异均无统计学意义(P>0.05)。伊朗人群研究仅有1篇关于rs2839698 SNP位点与乳腺癌关联的文献,统计分析显示,等位基因(Z=4.93,OR=2.524,95%CI:1.747~3.645,P<0.001)、加性模式(Z=4.64,OR=6.264,95%CI:2.884~13.605,P<0.001)、隐性模式(Z=4.49,OR=4.405,95%CI:2.307~8.412,P<0.001)、显性模式(Z=3.19,OR=2.659,95%CI:1.457~4.853,P=0.001)在病例组与对照组间比较,差异均有统计学意义(P<0.05)。见表4。

2.3发表偏倚Begg′s检验结果 LncRNA H19基因rs217727 SNP位点4种遗传模式均无发表偏倚(P>0.05)。而rs2839698 SNP位点等位基因、加性模式、隐性模式均存在发表偏倚(P<0.05),显性模式无发表偏倚(P=0.067)。见表4。

3 讨 论

LncRNA H19基因位于常染色体11p15.5,与胰岛素样生长因子2(IGF2)基因相邻,仅在母系遗传染色体上表达。LncRNA H19基因由于存在选择性剪切,因此包含了3种转录本,3种转录本都包含了5个外显子和4个内含子[12,22]。LncRNA H19 RNA转录本以调节RNA或核糖体调节器的形式发挥作用,促进细胞凋亡、血管形成、炎症和细胞死亡等生物学过程的进展[23]。另外,BAO等[24]的基因富集分析发现,LncRNA H19基因与DNA转录、RNA折叠、甲基化等均有关。LncRNA H19基因的表达水平与乳腺癌的发生、增殖、侵袭、转移和耐药有关,血清中LncRNA H19 RNA转录水平对乳腺癌的早期诊断、治疗和预后具有重要的临床意义[23]。LIN等[18]发现,在中国乳腺癌患者的共显性和显性模式中,LncRNA H19基因高表达与乳腺癌发生的风险增加相关,并且在雌激素受体阳性、人表皮生长因子受体2阴性的患者中共显性和显性模式差异更明显。

多项研究发现,LncRNA H19基因rs217727 SNP位点增加了乳腺癌的患病风险[18-19,25],进一步研究发现,乳腺癌组织中LncRNA H19基因的表达水平明显高于正常对照组织,并且发现CT或TT基因型有助于提高LncRNA H19基因的表达水平[18]。然而,XIA等[17]验证了中国汉族人群乳腺癌患病风险与LncRNA H19基因并无关联。本研究分析了关于rs217727 SNP位点的5篇文献,共包括乳腺癌患者3 178例和健康对照者3 392例,结果显示,rs217727 SNP位点的等位基因、加性模式、显性模式、隐性模式在病例组和对照组间比较,差异均无统计学意义(P>0.05)。在随后的人群分层分析中发现,中国汉族人群和伊朗人群rs217727 SNP位点4种遗传学模式在病例组与对照组间比较,差异均无统计学意义(P>0.05)。rs2839698位于LncRNA H19基因外显子区(3′-未翻译区)中。YANG等[26]发现,rs2839698 T等位基因与胃癌发病的高风险有关,并且CT和TT基因型的血清mRNA表达水平明显高于CC基因型。本研究分析了3篇关于rs2839698 SNP位点与乳腺癌遗传易感性的文献,囊括了2 607例乳腺癌患者和2 827例健康对照者,rs2839698 SNP位点的等位基因、加性模式、显性模式、隐性模式在病例组和对照组间比较,差异均无统计学意义(P>0.05)。进一步行人群分层分析发现,中国汉族人群rs2839698 SNP位点4种遗传学模式在病例组与对照组间比较,差异均无统计学意义(P>0.05)。伊朗人群研究仅有1篇关于rs2839698 SNP位点与乳腺癌关联的文献报道,统计分析发现,其4种遗传学模式在病例组与对照组间比较,差异均有统计学意义(P<0.05)。上述结果的不一致很可能是由于不同研究人群的样本量不同、遗传背景差异导致的。

本文尚存在一定的不足之处:(1)纳入研究的人群仅包括了中国汉族人群和伊朗人群,覆盖人群和数据量均较少,Meta分析结果可能存在偏倚。(2)本文纳入的文献数较少,结果仍需要更多、更高质量的研究证实;(3)对照组标本来源包括了医院人群和社区人群,但未进行对照组来源的亚组分析。后续笔者将持续关注LncRNA H19基因rs217727和rs2839698 SNP位点与乳腺癌遗传易感性的文献报道,对更大样本量和多种群的研究进行Meta分析,获得更加明确的关联结果。

综上所述,中国汉族人群LncRNA H19基因rs217727和rs2839698 SNP位点等位基因、加性模式、显性模式、隐性模式与乳腺癌遗传易感性均无关。

猜你喜欢
基因型位点异质性
Meta分析中的异质性检验
HBV基因型的研究现状与发展趋势探讨
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
DNA脱碱基位点的检测方法及其生物学研究进展
城市规模与主观幸福感——基于认知主体异质性的视角
临床常见革兰阴性菌异质性耐药研究进展
HBeAg阴性慢性乙型肝炎患者B、C基因型 HBV S蛋白变异比较
基于可持续发展的异质性债务治理与制度完善
基因型和表现型的快速判断法
一种改进的多聚腺苷酸化位点提取方法