·综述·
蛋白质和多肽的 N 端测序技术研究进展
赵丽艳,张养军,钱小红
氨基酸序列测定是了解蛋白质性质和功能的重要途径, N 端区域又是蛋白质及多肽重要的结构和功能部位,其序列特异性很高,通过 N 端的少数几个氨基酸残基就可以对大多数蛋白质进行鉴定[1]。例如,可以通过对蛋白质和多肽类药物的 N 端进行人工修饰(如环化修饰、甲基化修饰等),提高其降解稳定性延长药效[2-3]。因此 N 端肽段的鉴定具有非常重要的意义,本文对近年来蛋白质和多肽 N 端测序技术及方法进行了综述。
团的方法,例如用蛋白酶去除 N 端焦谷氨酸和通过酸催化的亲核取代去除 N 乙酰化丝氨酸和 N 乙酰化苏氨酸残 基[12]等,但都只适于一定残基的特定修饰,没有普遍适用性,且许多末端残基修饰是无法移去的;③不适于高通量分析,灵敏度不够[13]。但是 Edman 降解对于整体纯化的蛋白的 N 端序列分析仍是很有价值的研究工具。
人们还利用 RT-PCR 从编码蛋白质的 mRNA 得到其 cDNA 序列,再根据遗传密码表反推出其相应的氨基酸序列。20 世纪 80 年代出现了从基因组中找出编码蛋白质的基因,测定其 DNA 序列,再反推出蛋白质的氨基酸序列的技术。其特点是更加简便、快速,但利用 RT-PCR 或测定基因组的碱基序列也不能完全描述蛋白质的一级结构,它对翻译加工所导致的氨基酸残基的修饰及突变等情况无能为力。 2.2 质谱技术
质谱(MS),尤其是电喷雾(electraspray ionization,ESI)和基质辅助激光解吸电离-飞行时间(matrix-assisted laserd desorption/ionization time-of-fight,MALDI-TOF)的出现,使质谱技术在蛋白质结构分析中的应用发生了革命性的飞跃。高灵敏度、高准确性、高分辨率和高通量的生物质谱技术为蛋白质的 N 端测序提供了一种重要的选择。 2.2.1 阶梯式测序 是间接肽序列测定技术[14],通过末端酶解或化学降解产生一组相互之间仅差一个氨基酸残基的多肽系列,经 MALDI-TOF MS 鉴定后,根据所得到的肽阶梯图中各肽段的相对分子质量差值确定末端的氨基酸序列,从而用于数据库查询。阶梯测序是最早探索用质谱进行经过几个 Edman 反应循环的肽段混蛋白质测序的例子[15],
合物被 MALDI MS 检测,原始肽段的序列就可从质谱测得的梯形序列里得到阐明。另外,Zhong 等[16]还提出了质谱结合微波辅助酸水解的阶梯式测序方法,通过 25% 的三氟乙酸溶解蛋白质,用普通微波辐射 10 min 后,用质谱直接检测其酸水解的梯度产物进行蛋白质序列的分析。 2.2.2 化学标记结合质谱 许多对末端肽的研究方法采用的是质谱技术与多种化学方法及生物酶法的结合,通过 N 端的各种化学标记,运用 MS/MS 或多级质谱(MSn)的碰 基金项目:国家自然科学基金(20505018,20635010);国家高技术研究发展计划(863 计划)(2006AA02A312);国家重点基础研究发展规划(2006CB91080,2007CB914104)
作者单位:102206 北京,军事医学科学院放射与辐射医学研究所蛋白质组学国家重点实验室/北京蛋白质组研究中心 通讯作者:钱小红,Email:qianxh1@yahoo.com.cn 收稿日期:2008-03-13
1 蛋白质和多肽 N 端的重要生物学功能
所有蛋白质合成都起始于 N 端,其序列组成对其生物学功能有着巨大的影响。①蛋白质的半衰期与 N 端氨基酸的特异性有关,或者说 N 端氨基酸残基对蛋白质的寿命有②N 端序列与蛋白质的亚细胞器定位有密切关控制作用[4];
系,例如,某些特殊的氨基酸序列可以作为蛋白质分选标记影响蛋白质定位[5];③蛋白质的 N 端可发生许多种翻译后修饰,影响其结构和功能。如在新生肽链的成熟过程中,2/3 的叶绿体蛋白质会发生起始甲硫氨酸残基的剪切和前导肽的去除[6];又如核心组蛋白 N 端赖氨酸的可逆乙酰化修饰使组蛋白与 DNA 间的作用减弱, 导致染色体局部解旋,促进基因转录,而去乙酰化则抑制基因转录。这种乙酰化和去乙酰化过程中的任何异常都会导致生长、发育的紊乱, 诱发白血病、皮肤癌等疾病[8]。因此,通过对蛋白质 N 端序列的研究有利于分析蛋白质的高级结构,揭示蛋白质的生物学功能。
[7]
2 蛋白质和多肽 N 端测序技术
2.1 非质谱技术
1955 年,Frederick Sanger 采用二硝基氟苯(FDNB)法,首次成功地完成了第一个蛋白质——牛胰岛素的序列分析。在此测序方法的基础上,瑞典有机化学家 Edman[9]提出了蛋白质 N 端顺序测定方法——Edman 降解。之后随着基于此原理的液相、固相及气相自动蛋白质序列分析仪的推出和逐步完善,经典的 Edman 降解法已经广泛应用于蛋白质的 N 端测序。Chen 等[10]在微流控芯片上进行 Edman 反应,使得肽段测序的灵敏度提高到亚飞摩尔水平;并利用 Edman 反应 2 次循环得到肽段的串联质谱(MS/MS)图的 b2 离子为内标,获得了更好的二级质量准确度[11],实现了肽段快速、可靠的测序。
但 Edman 降解方法受到以下诸多限制:①用于序列分析的蛋白质或多肽必须是高纯度的;②N 端封闭的蛋白质难以进行 Edman 反应,虽然出现了一些去除 N 端封闭基
中国医药生物技术 2008年6月第3卷第3期 Chin Med Biotechnol, June 2008, Vol. 3, No. 3 215
撞诱导裂解(collision induced dissociation,CID)[17]、源后裂解(post-source decay,PSD)[18]等碎裂技术测序,或标记的 N 端肽段先经过选择性的分离,再进行从头测序
[19]
肽。Dormeyer 等[33]报道了一种迭代数据库搜索策略,对来自人胚胎癌细胞粗膜的肽段的强阳离子交换色谱(SCX)馏分进行末端肽的目标分析发现,鉴定到的非冗余 N 乙酰化肽段中,超过 80% 在 10 min 内被低盐流动相从 SCX 色谱柱上洗脱,表明 SCX 技术在一定程度上可用于蛋白质 N 端肽的分离。
最近,Coussot 等[34]使用金属内切蛋白酶 Lys-N,利用异硫氰酸苯酯修饰的玻璃珠共价结合中间肽,实现了碳酸酐酶封闭 N 端肽的分离和 MALDI-TOF MS 鉴定,这种反应有较好的特异性,但所用金属内切酶 Lys-N 的酶切作用过于温和,一些位点可能不会被切开,不利于 MALDI MS 的检测。Toshiyuki 等[35]最近也报道了用异氰酸基团来修饰 树脂,通过控制弱酸性反应条件去除胰蛋白酶酶切后所有 自由氨基端的肽段,很好地实现了封闭 N 端肽的分离及 MALDI MS 鉴定。这些新方法通过去除自由 N 端肽段,减少了体系的复杂程度,对 N 端肽的鉴定有着潜在的应用价值。
。
Noga 等[20]通过 N 端肽的乙酰化/氘代乙酰化的 1:1 修饰,运用快原子轰击(fast atom bombardment, FAB)质谱进行标记 N 端肽的鉴定。Keough 等[21]首先发现,通过在酶切肽段的 N 端引入带一个单位负电荷的磺酸基,有利于肽段的从头测序。这种酰化修饰可以促进肽链酰胺键在 MALDI 源质谱中的断裂并抑制 N 端碎片离子的生成,产生连续的 y 离子系列。本实验室曾通过邻磺基苯甲酸环酐对蛋白质的 N 端肽进行磺酸化修饰,使其在一级负离子模式下成为便于识别的基峰,并通过 MALDI MS 的 PSD 二级质谱分析,形成连续的 y 离子系列碎片,实现了对 N 端肽序列的测定[22]。Yamaguchi 等[23-24]将蛋白质经过还原、烷基化和侧链氨基的胍基化封闭,用不同的生物素类试剂标记自由的 N 端,标记后的蛋白质经胰蛋白酶酶切后,通 过抗生物素亲和体系将标记的 N 端肽分离出来,再通过 MALDI-TOF/MALDI-TOF-PSD MS 从头测序,获得了 N 端肽的序列。Gevaert 等[25]提出对角线色谱法(combined fractional diagonal chromatography,COFRADIC)进行 N 端肽的研究,利用肽段在末端氨基的 2,4,6-三硝基氟苯修饰前、后在反相色谱上的色谱行为的差异定位 N 端肽,从人血小板的细胞质和膜骨骼蛋白质组分中鉴定出 305 个 N 端肽,此法还应用于嗜盐菌的 N 端肽分析[26]。
N 端肽的化学修饰除了便于其检测,还被尝试用于蛋白质的相对定量研究。如通过合成磺苯基异硫氰酸(SPTIC)的稳定同位素类试剂 C-SPITC,与常规的 C-SPITC 试剂一起进行蛋白质标记,不仅有利于肽段从头测序,而且无论使用 MALDI-TOF/TOF 还是 RPLC-ESI-MS/MS,对标准蛋白的相对定量都得到了理想的效果[27-28]。Hsu 等[29]利用对 N 端肽的双甲基化标记,大大提高了衍生肽段在二级质谱中的 a1 离子信号。他们将这种在非衍生化肽段中很难被检测到的 a1 离子作为 N 端氨基酸的质量标签,增加了肽段从头测序和数据库检索的可靠性,并以血红蛋白为例考查了用于蛋白质相对定量的可行性[30]。
目前上述方法大多还处在在简单体系中探索的阶段,只有少数已应用于蛋白质组的 N 端分析,操作也很繁琐;N 末端天然封闭的蛋白质测序的方法还需要进一步改进。 2.2.3 N 端封闭蛋白质的端肽研究方法 蛋白质的 N 端常常发生甲基化、乙酰化、焦谷氨酸环化等各种修饰[31]。各种修饰使得 N 端被封闭,无法进行直接的 Edman 降解测序,也无法结合化学修饰进行质谱鉴定。且去除 N 端封闭基团的方法都不具普遍适用性。
如何将这种封闭的 N 端肽从大量自由 N 端肽段中分离出来,降低肽段混合物的复杂程度,提高 N 端肽质谱鉴定的机会,对蛋白质末端信息的获得和分析十分重要。Gorman 等
[32]
13
12
3 结语
综上所述,蛋白质和多肽的 N 端序列分析,随着经典方法、基于质谱的各种化学修饰以及酶法辅助技术不断地发展和完善,获得了丰富的末端肽序列信息,为蛋白质的准确鉴定提供了有力的依据,并加深了我们对蛋白质的结构和功能的理解。但目前现有的数据库仅提供了少量甚至不准确的而复杂生物体系中成千上万种蛋白质蛋白质 N 端信息[36],
的 N 端测序分析技术仍然是我们面临的巨大挑战,尤其是对 N 端的修饰多样性大规模地进行更详细的判定,还需要更有针对性的研究策略,今后的发展方向可能在选择性更好、修饰更可控的化学修饰试剂及修饰条件的探索;以及一些技术方法的交叉、整合和互补,以建立适用范围广、简便、快速的序列分析方法,增进研究技术的效率为目的,特别是提高其灵敏度和自动化程度。
参考文献
[1] Wilkins MR, Gasteiger E, Tonella L, et al. Protein identification with
N and C-terminal sequence tags in proteome projects. J Mol Biol, 1998, 278(3):599-608.
[2] Yang JZ, Chen W, Borchardt RT. In vitro stability and in vivo
pharmacokinetic studies of a model opioid peptide H-Tyr-D-Ala-Gly- Phe-D-Leu-OH (DADLE), and its cyclic prodrugs. J Pharmacol Exp Ther, 2002, 303(2):840-848.
[3] Marschütz MK, Zallner W, Mattner F, et a1. Improvement of the
enzymatic stability of a cytotoxic T-lymphocyte-epitope model peptide for its oral administration. Peptides, 2002, 23(10):1727-1733. [4] Bachmair A, Finley D, Varshavsky A. In vivo half-life of a protein is a
function of its amino-terminal residue. Science, 1986, 234(4773): 179-186.
[5] Emanuelsson O, Brunak S, von Heijne G, et al. Locating proteins in
the cell using TargetP, SignalP and related tools. Nat Protoc, 2007, 2(4):953-971.
[6] Giglione C, Boularot A, Meinnel T. Protein N-terminal methionine
最早提出使用离子交换色谱,利用封闭 N 端
肽与中间肽段的碱性不同,分离鉴定了病毒蛋白质的 N 端
216 中国医药生物技术 2008年6月第3卷第3期 Chin Med Biotechnol, June 2008, Vol. 3, No. 3
excision. Cell Mol Life Sci, 2004, 61(12):1455-1474.
[7] Walia H, Chen HY, Sun JM, et al. Histone acetylation is required to
maintain the unfolded nucleosome structure associated with transcribing DNA. J Biol Chem, 1998, 273(23):14516-14522. [8] Bodai L, Pallos J, Thompson LM, et al. Altered protein acetylation in
polyglutamine diseases. Curr Med Chem, 2003, 10(23):2577-2587. [9] Edman P. A method for the determination of amino acid sequence in
peptides. Arch Biochem, 1949, 22(3):475.
[10] Chen W, Yin X, Mu J, Yin Y. Subfemtomole level protein sequencing
by Edman degradation carried out in a microfluidic chip. Chem Commun, 2007, (24):2488-2490.
[11] Chen W, Yin X, Yin Y. Rapid and reliable peptide de novo sequencing
facilitated by microfluidic chip-based edman degradation. J Proteome Res, 2008, 7(2):766-770.
[12] Bergman T, Gheorghe MT, Hjelmqvist L, et al. Alcoholytic
deblocking of N-terminally acetylated peptides and proteins for sequence analysis. FEBS Lett, 1996, 390(2):199-202.
[13] Shively JE. The chemistry of protein sequence analysis. EXS, 2000,
88:99-117.
[14] Thiede B, Wittmann-Liebold B, Bienert M, et al .MALDI-MS for
C-terminal sequence determination of peptides and proteins degraded by carboxypeptidase Y and P. FEBS Lett, 1995, 357(1):65-69. [15] Chait BT, Wang R, Beavis RC, et al. Protein ladder sequencing.
Science, 1993, 262(5130):89-92.
[16] Zhong H, Zhang Y, Wen Z, Li L. Protein sequencing by mass analysis
of polypeptide ladders after controlled protein hydrolysis. Nat Biotechnol, 2004, 22(10):1291-1296.
[17] Chacon A, Masterson DS, Yin H, et al. N-Terminal amino acid
side-chain cleavage of chemically modified peptides in the gas phase: a mass spectrometry technique for N-terminus identification. Bioorg Med Chem, 2006, 14(18):6213-6222.
[18] Wang D, Kalb SR, Cotter RJ. Improved procedures for N-terminal
sulfonation of peptides for matrix-assisted laser desorption/ionization post-source decay peptide sequencing. Rapid Commun Mass Spectrom, 2004, 18(1):96-102.
[19] McDonald L, Robertson DH, Hurst JL, et al. Positional proteomics:
selective recovery and analysis of N-terminal proteolytic peptides. Nat Methods, 2005, 2(12):955-957.
[20] Noga MJ, Lewandowski JJ, Suder P, et al. An enhanced method for
peptides sequencing by N-terminal derivatization and MS. Proteomics, 2005, 5(17):4367-4375.
[21] Keough T, Youngquist RS, Lacey MP. A method for high-sensitivity
peptide sequencing using postsource decay matrix-assisted laser desorption ionization mass spectrometry. Proc Natl Acad Sci U S A, 1999, 96(13):7131-7136.
[22] Zhou C, Zhang Y, Qin P, et al. A method for rapidly confirming
protein N-terminal sequences by matrix-assisted laser desorption/ ionization mass spectrometry. Rapid Commun Mass Spectrom, 2006, 20(19):2878-2884.
[23] Yamaguchi M, Nakazawa T, Kuyama H, et al. High-throughput
method for N-terminal sequencing of proteins by MALDI mass spectrometry. Anal Chem, 2005, 77(2):645-651.
[24] Yamaguchi M, Obama T, Kuyama H, et al. Specific isolation of
N-terminal fragments from proteins and their high-fidelity de novo sequencing. Rapid Commun Mass Spectrom, 2007, 21(20):3329- 3336.
[25] Gevaert K, Goethals M, Martens L, et al. Exploring proteomes and
analyzing protein processing by mass spectrometric identification of sorted N-terminal peptides. Nat Biotechnol, 2003, 21(5):566-569. [26] Aivaliotis M, Gevaert K, Falb M, et al. Large-Scale identification of
n-terminal peptides in the halophilic archaea halobacterium salinarum and natronomonas pharaonis. J Proteome Res, 2007, 6(6): 2195-2204. [27] Lee YH, Han H, Chang SB, et al. Isotope-coded N-terminal
sulfonation of peptides allows quantivative proteomic analysis with increased de novo peptide sequencing capability. Rapid Commun Mass Spectrom, 2004, 18(24):3019-3027.
[28] Guillaume E, Panchaud A, Affolter M, et al. Differentially
isotope-coded N-terminal protein sulphonation: combining protein identification and quantification. Proteomics, 2006, 6(8):2338-2349. [29] Hsu JL, Huang SY, Shiea JT, et al. Beyond quantitative proteomics:
signal enhancement of the a1 ion as a mass tag for peptide sequencing using dimethyl labeling. J Proteome Res, 2005, 4(1): 101-108. [30] Hsu JL, Chen SH, Li DT, et al. Enhanced a1 fragmentation for
dimethylated proteins and its applications for n-terminal identification and comparative protein quantitation. J Proteome Res, 2007, 6(6): 2376-2383.
[31] Meinnel T, Peynot P, Giglione C. Processed N-termini of mature
proteins in higher eukaryotes and their major contribution to dynamic proteomics. Biochimie, 2005, 87(8): 701-712.
[32] Gorman JJ, Shiell BJ. Isolation of carboxyl-termini and blocked
amino-termini of viral proteins by high-performance cation-exchange chromatography. J Chromatogr, 1993, 646(1):193-205.
[33] Dormeyer W, Mohammed S, Breukelen B, et al. Targeted analysis of
protein termini. J Proteome Res, 2007, 6(12):4634-4645.
[34] Coussot G, Hawke DH, Mularz A, et al. A method for the isolation of
blocked N-terminal peptides. Anal Biochem, 2007, 361(2):302-304. [35] Mikami T, Takao T. Selective isolation of N-blocked peptides by
isocyanate-coupled resin. Anal Chem, 2007, 79(20):7910-7915. [36] Meinnel T, Giglione C. Tools for analyzing and predicting N-terminal
protein modifications. Proteomics, 2008, 8(4):626-649.
因篇幅问题不能全部显示,请点此查看更多更全内容