二代噬菌体展示淘选PD-1 结合肽及其模拟位点分析

2021-12-02 06:41贺碧芳张浅阅杨珊珊龙金金叶邵兵
电子科技大学学报 2021年6期
关键词:残基噬菌体文库

贺碧芳,陈 雪,张浅阅,杨珊珊,龙金金,叶邵兵

(1. 贵州大学医学院 贵阳 550025;2. 重庆市开州区人民医院 重庆 开州区 405400)

PD-1 是程序性细胞死亡受体1(programmed cell death protein 1, CD279)的 英 文 简写;而PDL1(programmed cell death 1 ligand 1, CD274)则是该受体的一型配体。PD-1 属CD28 家族,主要表达在T 细胞上。PD-L1 属于B7 家族,在黑色素瘤等几十种人类肿瘤组织及肿瘤细胞上高表达。文献[1- 2]的研究表明,阻断PD-1/PD-L1 信号通路可激活肿瘤抗原特异性T 细胞,对于恶性肿瘤具有较好的治疗作用。因此,PD-1 和PD-L1 成为了目前肿瘤免疫治疗的热门靶点,在国内外掀起了PD-1/PD-L1通路抑制剂研发的热潮。

迄今为止,针对PD-1 靶点的抗体药物纳武单抗(nivolumab)、帕姆单抗(pembrolizumab)和西米普利单抗(cemiplimab)以及针对PD-L1 靶点的抗体药物阿替利珠单抗(atezolizumab)、阿维鲁单抗(avelumab)和度伐利尤单抗(durvalumab)已获得美国食品药品监督管理局(FDA)批准上市[3-7],还有许多其他抗体药物正处于临床试验阶段[8]。前期研究表明,虽然阻断PD-1/PD-L1 通路的抗体药物对于癌症有一定的治疗效果[9],但存在个体差异大(只对大约20%的患者产生持久反应[10])、易引发不恰当的免疫反应[11]等问题。此外,治疗性抗体开发难度大,生产成本较高[12],同时抗体疗法本身存在一些固有的缺陷,如器官或肿瘤渗透性差、口服生物利用度差等。相较于抗体药物,多肽药物在分子质量水平上与小分子化学药物相近,在生物活性上与蛋白质药物相近,集蛋白质药物与传统化学药物的优点于一身。此外,多肽药物分子还拥有结构小、易改造、易合成等优点。但是,多肽稳定性差、半衰期短,这成为了多肽开发成药物得到应用的重大限制。但目前已有多种长效多肽药物方法如改变构型、化学修饰和融合蛋白技术等可用来延长多肽药物在体内的半衰期[13],因此,有望开发出治疗恶性肿瘤的多肽药物。

高内涵和高通量的表面展示技术(surface display)是一种常用的筛选多肽配体的方法,其中的噬菌体展示技术(phage display)[14]在筛选候选多肽方面具有耗时少、操作简单等优势。在噬菌体展示淘选实验中,先将蛋白质等靶标(target)[15-16]固定,与噬菌体展示文库一起温育,经过几轮选择和增殖的生物淘选(biopanning)[17],得到与靶标特异性结合的噬菌体,最终通过测序确定展示的外源多肽序列。在传统的噬菌体展示实验中,经过几轮生物淘选后,随机挑选出几十或几百个噬菌体克隆进行第一代DNA 测序。由于噬菌体展示文库的多样性,低通量的第一代DNA 测序仅分析了库容的九牛一毛(<0.01%)。近10 年间,高通量测序逐渐应用在噬菌体展示领域,形成的二代噬菌体展示技术(nextgeneration phage display, NGPD)可一次性分析几百万条序列,保留了文库的原始多样性,并能淘选出代表性不足的克隆,这些克隆在传统噬菌体展示淘选实验中大多丢失[18-20]。而采用二代噬菌体展示技术筛选靶标特异性结合肽,需要的淘选实验轮数更少,可加快发现与开发多肽配体的节奏。此外,二代噬菌体展示技术还能有效抑制靶标无关肽出现在最终的淘选结果中[21]。目前,已报道了一些借助传统噬菌体展示淘选得到的阻断PD-1/PD-L1 相互作用的PD-1 结合肽与PD-L1 结合肽[11,22-25]。然而,通过检索生物淘选数据库BDB[26-27],发现还未有研究者采用二代噬菌体展示技术淘选PD-1 结合肽。

本研究为了获得更多新型的PD-1 结合肽,采用重组人PD-1 蛋白为靶标,分别淘选Ph.D.-7 和Ph.D.-12 噬菌体展示文库,获得了400 条潜在的PD-1 结合肽。然后,对获得的PD-1 结合肽数据集进行了聚类分析、氨基酸组成与基于位置的氨基酸偏好性分析,发现了一些PD-1 结合肽的序列组成特性。通过模拟位点分析,发现模拟位点残基与PD-L1 上的真实表位残基有一定的重叠,揭示了淘选出的PD-1 结合肽可能模拟了PD-L1 蛋白的部分特性。本文结果将对计算机辅助设计PD-1 结合肽有一定的指导意义。淘选出的PD-1 结合肽可作为阻断PD-1/PD-L1 相互作用的多肽药物开发的候选多肽。

1 材料与方法

1.1 PD-1 淘选Ph.D.-.7 和Ph.D.-.12 噬菌体展示文库

本文采用重组人PD-1 蛋白(北京义翘神州科技有限公司)分别淘选Ph.D.-.7 和Ph.D.-12 噬菌体展示文库(New England Biolabs),获得PD-1 结合肽。按照Ph.D.TMPhage Display Libraries Instruction Manual中“ Solution-phase Panning with Affinity Bead Capture”的实验流程进行两轮噬菌体展示淘选。在第二轮PD-1 淘选实验(R2-PD)时,同时进行了2 个对照淘选实验。在第一个对照淘选实验中,将经过第一轮PD-1 淘选(R1-PD)富集得到的噬菌体克隆与Dynabeads(Cat# 10-103-D, Invitrogen)进行孵育(R2-DB);在第二个对照淘选实验中,将第一轮淘选后富集的噬菌体克隆与无关的抗FLAG M2 单克隆抗体(Cat# F3165, Sigma-Aldrich)进行孵育(R2-UF)。随后,将第1 轮之前(R0)的文库、两轮淘选(R1 和R2)后的文库,送二代测序。

1.2 Illumina 双末端测序数据分析

测序完成后,采用二代噬菌体展示双末端测序数据分析方法分析原始测序数据[28]。使用单尾t 检验评估多肽在R2-PD 淘选实验中的拷贝数比率显著与否,只有序列在R2-PD 淘选实验中的拷贝数相较于各个对照样本中的拷贝数比率≥2 且p≤0.05 才被视为PD-1 结合肽。

1.3 聚类分析

BLOSUM62 是生物信息学中应用最广的氨基酸替换打分矩阵[29],常用于序列对比。本研究根据BLOSUM62 打分矩阵分别对来自Ph.D.-7 噬菌体展示文库的PD-1 结合肽和来自Ph.D.-12 噬菌体展示文库的PD-1 结合肽进行聚类分析。

1.4 Two Sample Logo

使用Two Sample Logo(TSL)工具来分析多肽序列中特定位置的氨基酸偏好[30]。该工具需要固定长度的多肽序列作为输入,因此分别使用来自Ph.D.-7 噬菌体展示文库的PD-1 结合肽和非PD-1 结合肽以及来自Ph.D.-12 噬菌体展示文库的PD-1 结合肽和非PD-1 结合肽来产生TSL。

1.5 模拟位点分析

采用EpiSearch[31]分别对聚类后的每种类别的PD-1 结合肽进行构象性表位分析,将PD-1 结合肽映射到PD-L1 晶体结构(PDBID: 4ZQK,链A)[32]的表面,然后对每种类别中每条肽的映射结果取并集,作为该类别下PD-1 识别的PD-L1 上的模拟位点。最后对每种类别PD-1 结合肽映射结果取并集,作为PD-1 识别的PD-L1 上的模拟位点。将上述得到的模拟位点与PD-L1 上的真实表位进行比较。

2 结果与讨论

本研究的实验流程如图1 所示,首先进行了二代噬菌体展示淘选实验,采用重组人PD-1 蛋白为靶标,分别淘选Ph.D.-.7 和Ph.D.-12 噬菌体展示文库,两轮淘选后获得高度结合PD-1 的噬菌体克隆,随后进行Illumina 高通量测序。第二阶段主要是确定PD-1 结合肽,如果多肽序列在第二轮PD-1 淘选后的文库中的拷贝数显著高于各个对照样本中的拷贝数,则认为该多肽为PD-1 结合肽。第三阶段主要是对PD-1 结合肽数据集进行聚类、氨基酸组成、基于位置的氨基酸偏好性分析以及模拟位点分析。

图1 本研究的实验流程示意图

2.1 二代噬菌体展示淘选PD-1 结合肽

经过两轮的噬菌体展示淘选实验与二代噬菌体展示双末端测序数据分析,最终确定了400 条PD-1结合肽序列,其中311 条来自Ph.D.-7 噬菌体展示文库,89 条来自Ph.D.-12 噬菌体展示文库。这些多肽在R2-PD 中高度富集,而在R0、R1-PD 和对照实验R2-DB 及R2-UF 中拷贝数较低。

随机从余下的Ph.D.-7 多肽数据中挑选311 条多肽作为非PD-1 结合肽,从Ph.D.-12 多肽数据中挑选89 条多肽作为非PD-1 结合肽用于后续特定位置的氨基酸偏好分析。

2.2 聚类分析

根据BLOSUM62 打分矩阵进行聚类分析,来自Ph.D.-7 噬菌体展示文库的311 条PD-1 结合肽聚成了9 个类,来自Ph.D.-12 噬菌体展示文库的89 条PD-1 结合肽聚成了4 个类。

2.3 氨基酸组成分析

PD-1 结合肽的氨基酸组成如图2 所示,成分差异清晰可见。分别对3 个PD-1 结合肽数据集进行了分析,相比其他氨基酸,丙氨酸A、亮氨酸L、脯氨酸P、丝氨酸S 和苏氨酸T 在PD-1 结合肽中含量较高,这表明这些氨基酸在与PD-1 结合中起着至关重要的作用。

图2 PD-1 结合肽数据集氨基酸组成

2.4 特定位置的氨基酸偏好分析

PD-1 结合肽数据集基于位置的氨基酸偏好性采用Two Sample Logo 软件分析,氨基酸偏好性趋势如图3 所示。图3a 表明,天冬酰胺N 偏向于出现在311 条PD-1 结合肽的前两个位置,组氨酸H 和甘氨酸G 分别偏向于出现在第3 个和第4 个位置,谷氨酰胺Q 和酪氨酸Y 更倾向于出现在第7 个位置。图3b 表明,对于来自Ph.D.-12 噬菌体展示文库的89 条PD-1 结合肽,亮氨酸L 和缬氨酸V 偏好第2 个位置,异亮氨酸倾向于出现在第6 个位置。

图3 PD-1 结合肽数据集基于位置的氨基酸偏好性

2.5 基于PD-1 结合肽的模拟位点分析

使用EpiSearch 将PD-1 结合肽映射到PDL1 晶体结构(PDBID:3B5H,链A)的表面,分别将来自Ph.D.-12 噬菌体展示文库的89 条PD-1 结合肽和来自Ph.D.-7 噬菌体展示文库的311 条PD-1结合肽按聚类结果进行分析。311 条源自Ph.D.-7噬菌体展示文库的PD-1 结合肽分成9 个类进行模拟位点分析,EpiSearch 均未给出结果,其参数设置为Patch Size = 10,Area cutoff = 5,Accuracy cutoff = 3。如表1 所示,来自Ph.D.-12噬菌体展示文库的89 条PD-1 结合肽分成4 个类进行模拟位点分析,在EpiSearch 默认参数下,只有Cluster 1 与Cluster 2类得到了模拟位点结果;对于Cluster 3 与Cluster 4,EpiSearch 未给出结果。表中加粗显示的残基同时出现在真实的PD-L1 上的表位残基与模拟位点残基中,比较得到的模拟位点残基与PD-L1 上的真实表位残基,发现两者有9 个位点残基是一致的。上述结果表明,基于噬菌体展示淘选数据的模拟位点分析有一定的可靠性。同时,虽然Cluster 1 和Cluster 2 按照聚类分析聚成了两类,但是模拟位点分析得到的构象性表位残基是完全一致的,而且模拟位点残基与PD-L1 上的真实表位残基具有较高的一致性,因此推断Cluster 1 和Cluster 2 中的PD-1 结合肽可能模拟了PD-L1 蛋白的部分特性,这些多肽可作为后期药物开发的候选多肽。此外,根据模拟位点分析结果,Cluster 3 和 Cluster 4 中的PD-1 结合肽以及来自 Ph.D.-7 噬菌体展示文库的311 条 PD-1 结合肽的结合位点与真实的表位残基可能不一致,所以这些多肽可能对于后期药物开发的意义不大。

表1 来自Ph.D.-12 噬菌体展示文库的89 条PD-1 结合肽的模拟位点分析结果

3 结 束 语

PD-1 结合肽是治疗癌症的潜在治疗药物。本研究通过二代噬菌体展示淘选获得的PD-1 结合肽有望开发成阻断PD-1/PD-L1 相互作用的候选多肽药物。基于BLOSUM62 打分矩阵进行了聚类分析,淘选出的400 条PD-1 结合肽聚成了13 类。对PD-1 结合肽数据集进行了氨基酸组成与基于位置的氨基酸偏好性分析,发现丙氨酸A、亮氨酸L、脯氨酸P、丝氨酸S 和苏氨酸T 在与PD-1 结合中起着非常重要的作用。且PD-1 结合肽的氨基酸组成有一定的位置偏好性。模拟位点分析揭示了淘选出的PD-1 结合肽可能模拟了PD-L1 蛋白的部分特性。希望上述结果对PD-1 结合肽的计算设计有一定的指导意义。

本研究仍然存在不足之处,未对淘选出的潜在PD-1 结合肽进行体外与体内实验,因此未评估能否结合PD-1、能否阻断PD-1/PD-L1 相互作用。在后续的工作中,将进一步开展实验验证,并基于机器学习构建PD-1 结合肽预测工具,填补快速获取PD-1 结合肽计算工具的空白。

猜你喜欢
残基噬菌体文库
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
不同富集培养方法对噬菌体PEf771的滴度影响
专家文库
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
优秀传统文化启蒙文库
科学家发现最大噬菌体
关于推荐《当代诗坛百家文库》入选诗家的启事
专家文库
蛋白质二级结构序列与残基种类间关联的分析
副溶血弧菌噬菌体微胶囊的制备及在饵料中的应用