生物医学发展的一个新动向——蛋白质组研究现状和展望
1 介绍
1.1 蛋白质组的概念
二十世纪七十年代以来,对于生命体的研究集中在基因组学和基因工程。1988年发起的人类基因组规划(the human genome project,HGP),大大推动了分子生物学的发展,在不久的将来,所有分子水平上的遗传信息便会被破译。
然而,随着基因组学的飞速进展,人们逐渐看到了决定基因在细胞内功能的必要性。蛋白质组(proteome)便是由此提出的一个新的概念。1994年,澳大利亚悉尼Maquarie大学的Marc Wilkins等首先将蛋白质组定义为“基因组所表达的全部蛋白质[1]。”这个概念的提出标志着一个新的学科——蛋白质组学(proteomics)的诞生,即“定量检测蛋白质水平上的基因表达,从而揭示生物学行为(如:疾病过程和药物效应),以及基因表达调控的机制[2]。”的学科。
1.2 蛋白质组与基因组研究的比较
与具有同源性和普遍性的基因组相比,蛋白质组具有动态性、时间性、空间性和特异性。另一方面,就数量而言,蛋白质组内的蛋白质数并不等于基因组内编码蛋白质的基因数目。Anderson等首先绘出了多基因细胞mRNA与相应表达的蛋白质的量化比较图,发现两者的相关系数为0.48[3],说明了两者数量的差异性。因此,生物学家们又将蛋白质组定义为“细胞内包含的全部蛋白质。[4]”
蛋白质的研究水平与DNA,mRNA研究相比是落后的,这归咎于需要复杂的技术去分离,分析和鉴定一个典型基因组所编码的数千种蛋白质。而且蛋白质在细胞内的功能是不同的,所以研究一种蛋白质的技术不一定适用于其它蛋白质。目前研究蛋白质所采用的技术主要有三种:双相电泳(2-D gel electrophoresis,2-DPAGE)分离,质谱(mass spectrometry,MS)鉴定和数据库的建立。
1.3 蛋白质组研究的意义
蛋白质是基因的表达产物,针对疾病,环境刺激,胚胎发育以及衰老,一个基因产物的合成率、降解率、功能完成、翻译后修饰程度、亚细胞水平的分布以及与其它细胞成分的相互作用是非常重要的。蛋白质组分析将为此提供有意义的数据信息,作为病因及诊断依据。另外,大量的药物效应研究显示药物的治疗机制即包括其与靶位的结合,也包括基因表达的蛋白质的调控。蛋白质组的研究将为疾病的治疗提供更为广阔的前景。而且,生命现象的复杂性使单一的生命学科不足以揭示全面生命机制。生理、病理及生物物理等涉及到的生物学行为和功能是与其执行者——蛋白质密不可分的,因此,蛋白质组学也将促进其它学科的发展。
目前,蛋白质组研究已广泛应用于生命科学,本文将就其研究技术,应用现状,以及未来发展做一些探讨。
2 蛋白质组研究技术
2.1 双相电泳(2-D PAGE)——蛋白质分离技术
双相电泳由O'Farrell于1975年首先创建。虽然并不是一项新技术,其仍成为目前获得蛋白质图谱的最主要手段。基本原理是蛋白质首先于第一相根据其等电点在pH梯度胶中等电聚焦(isoelectric focusing or IEF),然后在第二相按照各蛋白质的分子量大小(SDS-PAGE)进行第二次电泳分离。与一维的IEF或SDS-PAGE相比,双相电泳具有更高的分辨率,其可以分辨3000多种蛋白质。
传统双相电泳根据低分子量的氨基酸具有不同的等电点,采用两性电解质作为载体,在外加电场下产生pH梯度;而新的稳定pH胶(immobilized pH gel,IPG)技术则利用丙烯酰胺的酸碱衍生物可以在胶聚合的过程□价结合于聚丙烯酰胺基质的特点,产生稳定的pH梯度[5]。
样品在系统中的溶解性与最终的分辨结果密切相关。目前,许多改进双相电泳的研究都着眼于增加蛋白的溶解度。
2.2 质谱(Mass spectrometry,MS)——蛋白质鉴定技术
质谱已成为将蛋白质与其基因联系起来的重要工具,广泛用于蛋白质组的研究中,其基本原理是使极曰虼?绲姆肿硬???嗬胱樱??莶煌?胱蛹涞闹***杀?m/z)来分离并确定分子量。离子化技术的提高使质谱技术得到了进一步发展。快速原子轰击(FA可以使双分子物质离子化,电喷雾离子化(ESI)和基质辅助的激光解吸离子化(MALDI)是更新的“软离子化法”,它们被应用于多肽和蛋白质的离子化[6]。
将化学和酶学的方法与质谱相结合,可以获得由不完整的短肽所组成的序列梯度,以测定核酸序列。如用羟肽酶Y降解产生截去C末端残基的短肽,然后使用FAB或MALDI/TOF(time-of-fight)离子化[7];我们还可以通过将已知序列蛋白质的数据库中的质荷比与实验测得的结果进行比较,从而推出待测序列。
与传统的Edman降解法,Western印迹分析相比,质谱分析更为灵敏、精确、经济,简便。
2.3 蛋白质组数据库(proteomic database)——生物信息学
生物信息学(bioinformatics)使用计算机技术储存和分析生物学信息,由此建立的基因组数据库加速了分子生物学的进展。蛋白质组数据库将是生物信息学的新领域。
目前,双相电泳结果可以采用电荷耦合器件——照相系统或扫描成像,再使用计算机辅助的影像分析和数据分析,解释电泳结果。最早的双相电泳胶数据库建立于1992年,其站点名称为SWISS-2DPAGE[8]。自此,更多的数据库(主要为21种),及含有质谱分析软件的程序库都可以在互联网上获得[9]。
3 蛋白质组研究应用现状
目前,蛋白质组分析已在生命科学中广泛开展起来,既推进了分子生物学和其他交叉学科的发展,又为病因,诊断以及疾病的治疗,提供了宏观水平上的依据和信息。下面,将对不同的生物体系的研究现状进行阐述。
3.1 细菌的蛋白质组研究
随着核酸测序技术的快速发展,一些细菌的基因组序列已经完成。科学家们相信在若干年后将清楚的了解细菌的蛋白质功能。以下是几种细菌的蛋白质组分析近况。
大肠杆菌通常被认为是研究细菌生理和基因表达的模型菌种,在最早的双相电泳研究中,研究对象局限于生长于固定条件下的大肠杆菌,仅仅检测出了极少量的蛋白质,1996年,VanBogelen等绘制了大肠杆菌的基因表达图谱,在此图中详细描述了不同生长条件下的蛋白的表达形式;他们采用计算机辅助影像替代了以往的荧光显色,鉴定了约25%的1550种电泳分离蛋白质[10]。目前,大肠杆菌的蛋白质双相电泳数据库主要是:ECO 2DBASE[9]。
另外,对多种细菌的蛋白质组成研究也在进行,如Langen等鉴定了约400种嗜血流感菌Rd菌种蛋白[11],还有涉及棒状杆菌,结核杆菌等的蛋白质组研究。
3.2 酵母的蛋白质组研究
我们已经获得了完整的酵母的基因组序列,但只有将其蛋白质成份进行分离,并加以鉴定,才能对基因的功能和与之伴随的生命现象进行解释。
双相电泳依然是分离蛋白质的主要手段。传统蛋白鉴定方法:抗体杂交等,需要繁琐的工作,大量的样品。Shevchenko等在胶内将电泳分离蛋白质用胰蛋白酶水解后,使用自动化MALDI及ESI分析所得的多肽混合物。根据数据库检索,成功鉴定了酵母S288C的150种蛋白质胶点,包括32种以前未报道的蛋白质[12],该质谱鉴定的方法更为全面准确,将基因与蛋白质联系了起来。
3.3 鼠类的蛋白质组研究
鼠类是常用实验动物,跨越种属界限的比较,将为人类机体和疾病的研究提供有价值的依据。目前,鼠类蛋白质组研究涉及到不同系统和器官。
髓磷脂是哺乳类在中枢神经系统产生高频高速的神经冲动所必需的物质,某些严重的神经障碍的发生是与髓磷脂的缺失相关的。1988年,Jensen等将原癌基因c-myc转入小鼠中,造成了髓磷脂的退行性紊乱,通过蛋白质组研究。发现细胞骨架蛋白的特征变化;α微管蛋白(αt)等积聚,基质蛋白等主要的髓磷脂蛋白减少[13]。该实验提供了新的蛋白质组疾病指标,测定这些蛋白质的氨基酸组成并将其mRNAs克隆,会进一步明确它们在疾病发生中的作用。
在对肾毒性的研究中,Witzmann等利用蛋白质组技术测定雄性小鼠肾皮质和髓质细胞胞液蛋白的变化,发现86种蛋白于皮质中含量高,41种高含于髓质中[14]。
鼠蛋白质组数据库目前已可以在互联网上获得,并有待进一步完善。如涉及多器官的Molecular anatomy laboratory等[9]。
3.4 人类蛋白质组研究
自70年代分子生物学起步以来,人类在基因水平上的自身认识不断丰富。不久的将来我们便可以获得完整的人类基因组图谱。我们还发现了许多疾病相关的变化:基因缺失,突变,重组,原癌基因等。然而,基因表达产物——蛋白质的变化,是导致生命功能失常的直接因素。因此,人类蛋白质组的研究,是揭示人类自身生命活动和疾病的机理的最终阶段。
目前,已部分建立了人体相关蛋白质双相电泳数据库,如SWISS-2DPAGE,其包含了血浆、肝、巨噬细胞系、红白血病细胞系、血小板、淋巴瘤、CSF,红细胞等多种生命系统的蛋白质双相电泳数据及图谱,再如JPSL 2D gel database,其为癌症研究提供了重要的蛋白质组信息[9]。
蛋白质组研究涉及正常蛋白质组成。如线粒体蛋白成份与能量代谢密切相关,1988年Rabilloud等使用具有高度重复性的IPG(pH4—8)双相电泳技术,并用银染色提高检测的敏感性,通过MALDI-TOF-MS鉴定,将人线粒体蛋白质组数据库扩展为171种蛋白质[15]。再如,Hansah等经过五年时间,使用二维电泳,发展了人淋巴蛋白质数据库[16]。
基因表达异常是引起疾病的一个重要环节,目前,对许多疾病开展了蛋白质水平的定量及功能检测,如心脏组织的蛋白质变化可以引起心脏功能的改变。Joseph M. Corbett等以扩张型心肌病死亡患者心脏组织为原料,通过二维电泳和计算机分析,发现88种蛋白质含量较正常对照减少,其中有收缩相关的肌球蛋白[17],这些蛋白质的减少也许与扩张型心肌病的蛋白酶活性的变化相关,另外,认为肌球蛋白的减少加重了心肌收缩障碍,从而导致心衰。
肿瘤的基因研究已取得了令人瞩目的进展,目前已经发现了许多肿瘤相关基因,并有一些基因表达的研究。蛋白质组学的建立,为肿瘤相关基因的表达和功能研究提供了更有力的手段。例如,膀胱癌在肿瘤中占有相当大的比重,临床工作中对膀胱癌的恶性度分级侧重于形态学特征。Celis等将新鲜低恶性度转移细胞癌TCCs细胞及其原代培养细胞进行蛋白质组分析,发现两者蛋白质成份有85%的蛋白差异[18],该研究有助于研究肿瘤的恶性度和侵袭性。乳腺癌严重危害女性健康,1998年,Rasmussen等,扩展了乳腺癌细胞系-MDA-MB231的Mr/pI数据库——增加了9种胞浆蛋白,3种Triton X-144可溶性膜蛋白,及一种新的蛋白质[19]。蛋白质组也用于研究血液系统发生的肿瘤,如人红白血病等。
4 蛋白质组研究展望
蛋白质组学的建立为研究蛋白质水平的生命活动开辟了更为广阔的前景,提供了新型有效的研究手段,但是从目前的情况来看,蛋白质组分析并不能覆盖所有基因表达产物。因此,科学家们提出了功能蛋白质组的概念,即特定时期或实验条件下基因组中活跃表达的蛋白质[4]。功能蛋白质组研究注重于从局部入手,以明确蛋白质群体的功能。这为未来的蛋白质组研究提供了更为可行的着手点。
蛋白质样品的准备直接影响到电泳及检测效果,目前已有多项关于增加蛋白质溶解性的报道,这提高了电泳的重复性。但是,高分子量蛋白质经二维电泳分离的效果仍有待提高。另外,亚细胞器分离技术的改进将有利于研究功能相关的蛋白质转移。
生命活动是一个连续的过程,连续监测蛋白质改变,将有助于揭示相关生理或病理过程的机制。国内文宗曜教授和美国圣地亚哥Shu Chien等建立了新型的同步化红细胞模型,研究正常生理条件下及基因调控异常情况下,在整个红细胞生命周期中蛋白质的改变所引起的微观流变学变化,以阐明红细胞衰老的机制[20—21]。体现了未来多学科交叉的发展趋势。
分子生物学的飞速发展很大程度上归因于研究技术的自动化。蛋白质分析技术相对于核酸分析技术更为复杂繁琐,目前还没有双相电泳自动化仪器研制成功。在蛋白质鉴定技术方面,仅有部分鉴定过程已实现自动化,如自动MALDI-TOF等。为实现整个过程的连续自动化处理,Traini等设计了机器人控制系统,取得了较理想的效果[22]。为今后的自动化发展奠定了基础。
5 小结
在又一崭新的世纪中,我们会看到生命科学的巨大变化,即从以DNA,mRNA测定为主的基因组学转移到蛋白质组学。虽然蛋白质组学的发展目前还受到许多因素的限制,如蛋白质的某些不易控制的特性,需要面对复杂的生物模型等。但是我们有理由相信蛋白质组学不但会促进基因组学的进一步发展,而且最终会超越基因组学。蛋白质组学与生理,病理,生物物理等多学科的交叉将更有助于揭示生命的本质。
编辑:dream1