文档视界 最新最全的文档下载
当前位置:文档视界 › 蛋白质四级结构装配原理的研究

蛋白质四级结构装配原理的研究

蛋白质四级结构装配原理的研究
蛋白质四级结构装配原理的研究

蛋白质结构与功能的关系

蛋白质结构与功能的关系 蛋白质的结构包括一级结构、二级结构、三级结构、四级结构。 一级结构是蛋白质的一级结构指在蛋白质分子从N-端至C-端的氨基酸排列顺序。一级结构是蛋白质空间构象和特异生物学功能的基础,但不是决定蛋白质空间构象的唯一因素。 蛋白质的二级结构是指多肽链的主链骨架本身在空间上有规律的折叠和盘绕,它是由氨基酸残基非侧链基团之间的氢键决定的。常见的二级结构有α螺旋、三股螺旋、β折叠、β转角、β凸起和无规卷曲。α螺旋中肽链骨架围绕一个轴以螺旋的方式伸展,它可能是极性的、疏水的或两亲的。β折叠是肽链的一种相当伸展的结构,有平行和反平行两种。如果β股交替出现极性残基和非极性残基,那么就可以形成两亲的β折叠。β转角指伸展的肽链形成180°的U形回折结构而改变了肽链的方向。β凸起是由于β折叠股中额外插入一个氨基酸残基而形成的,它也能改变多肽链的走向。无规卷曲是在蛋白质分子中的一些极不规则的二级结构的总称。无规卷曲无固定走向,有时以环的形式存在,但不是任意变动的。从结构的稳定性上看,右手α螺旋>β折叠> U型回折>无规卷曲,但在功能上,酶与蛋白质的活性中心通常由无规卷曲充当,α右手螺旋和β折叠一般只起支持作用。 蛋白质的三级结构是指多肽链在二级结构的基础上,进一步盘绕、卷曲和折叠,形成主要通过氨基酸侧链以次级键以及二硫键维系的完整的三维结构。三级结构通常由模体和结构域组成。稳定三级结构的化学键包括氢键、疏水键、离子键、范德华力、金属配位键和二硫键。模体可用在一级结构上,特指具有特殊生化功能的序列模体,也可被用于功能模体或结构模体,相当于超二级结构。结构模体是结构域的组分,基本形式有αα、βαβ和βββ等。常见的模体包括:左手超螺旋、右手超螺旋、卷曲螺旋、螺旋束、α螺旋-环-α螺旋、Rossmann卷曲和希腊钥匙模体。结构域是在一个蛋白质分子内的相对独立的球状结构和/或功能模块,由若干个结构模体组成的相对独立的球形结构单位,它们通常是独自折叠形成的,与蛋白质的功能直接相关。一个结构域通常由一段连续的氨基酸序列组成。根据其占优势的二级结构元件的类型,结构域可分为五大类:α结构域、β结构域、α/β结构域、α+β 结构域、交联结构域。以上每一类结构域的二级结构元件可能有不同的组织方式,每一种组织就是一种结构模体。这些结构域都有疏水的核心,疏水核心是结构域稳定所必需的。 具有两条和两条以上多肽链的寡聚蛋白质或多聚蛋白质才会有四级结构。组成寡聚蛋白质或多聚蛋白质的每一个亚基都有自己的三级结构。蛋白质的四级结构内容包括亚基的种类、数目、空间排布以及亚基之间的相互作用。驱动四级结构形成或稳定四级结构的作用力包括

蛋白质结构解析的方法对比综述 (1)

蛋白质结构解析的方法对比综述 工程硕士李瑾 摘要:到目前为止,蛋白质结构解析的方法主要是两种,x射线衍射法和NMR法,这两种方法各有优点和不足。 关键词:x射线衍射法 NMR法 到目前为止,蛋白质结构解析的方法主要是两种,x射线衍射法和NMR法。其中X射线的方法产生的更早,也更加的成熟,解析的数量也更多,第一个解析的蛋白的结构,就是用x晶体衍射的方法解析的。而NMR方法则是在90年代才成熟并发展起来的。这两种方法各有优点和不足[1]。 首先是X射线晶体衍射法。该方法的前提是要得到蛋白质的晶体。通常是将表达目的蛋白的基因经PCR扩增后克隆到一种表达载体中,然后转入大肠杆菌中诱导表达,目的蛋白提纯之后摸索结晶条件,等拿到晶体之后,将晶体进行x射线衍射,收集衍射图谱,通过一系列的计算,得到蛋白质的原子结构[2]。 x射线晶体衍射法的优点是:速度快,通常只要拿到晶体,最快当天就能得出结构,另外不受肽链大小限制,无论是多大分子量的蛋白质或者RNA、DNA,甚至是结合多种小分子的复合体,只要能够结晶就能够得到其原子结构。所以x射线方法解析蛋白的关键是摸索蛋白结晶的条件。该方法得到的是蛋白质分子在晶体状态下的空间结构,这种结构与蛋白质分子在生物细胞内的本来结构有较大的差别。晶体中的蛋白质分子相互间是有规律地、紧密地排列在一起的,运动性较差;而自然界的生物细胞中的蛋白质分子则是处于一种溶液状态,周围是水分子和其他的生物分子,具有很好的运动性。而且,有些蛋白质只能稳定地存在于溶液状态,无法结晶[2]。 核磁共振NMR(nuclear magnetic resonance)现象很早就被科研人员观察到了,但将这种方法用来解析蛋白质结构,却是近一二十年的事情。NMR法具体原理是对水溶液中的蛋白质样品测定一系列不同的二维核磁共振图谱,然后根据已确定的蛋白质分子的一级结构,通过对各种二维核磁共振图谱的比较和解析,在图谱上找到各个序列号氨基酸上的各种氢原子所对应的峰。有了这些被指认的峰,就可以根据这些峰在核磁共振谱图上所呈现的相互之间的关系得到它们所对应的氢原子之间的距离。[3]可以想象,正是因为蛋白质分子具有空间结构,在序列上相差甚远的两个氨基酸有可能在空间距离上是很近的,它们所含的氢原子所对应的NMR峰之间就会有相关信号出现[4] 。通常,如果两个氢原子之间距离小于0.5纳米的话,它们之间就会有相关信号出现。一个由几十个氨基酸残基组成的蛋白质分子可以得到几百个甚至几千个这样与距离有关的信号,按照信号的强弱把它们转换成对应的氢原子之间的距离,然后运用计算机程序根据所得到的距离条件模拟出该蛋白质分子的空间结构。该结构既要满足从核磁共振图谱上得到的所有距离条件,还要满足化学上有关原子与原子结合的一些基本限制条件,如原子间的化学键长、键角和原子半径等[4]。 NMR解析蛋白结构常规步骤如下:首先通过基因工程的方法,得到提纯的目的蛋白,在蛋白质稳定的条件下,将未聚合,而且折叠良好的蛋白样品(通常是1mM-3mM,500ul,PH6-7的PBS)装入核磁管中,放入核磁谱仪中,然后由写好的程序控制谱仪,发出一系列的电磁波,激发蛋白中的H、13N、13C原子,等电磁波发射完毕,再收集受激发的原子所放出的“能量”,通过收集数据、谱图处理、电脑计算从而得到蛋白的原子结构[5] [6]。 用NMR研究蛋白质结构的方法,可以在溶液状态进行研究,得到的是蛋白质分子在溶液中的结构,这更接近于蛋白质在生物细胞中的自然状态[7]。此外,通过改变溶液的性质,还可以模拟出生物细胞内的各种生理条件,即蛋白质分子所处的各种环境,以观察这些周围环境的变化对蛋白质分子空间结构的影响。在溶液环境中,蛋白质分子具有与自然环境中类

蛋白质四级结构及其检测方法

论述一、二、三、四级蛋白质结构及其检测方法? 蛋白质定义:由一条或多条多肽链以特殊方式结合而成的生物大分子,通常是将分子量在6000道尔顿以上的多肽称为蛋白质。 一、蛋白质一级结构: (一)定义:蛋白质的一级结构又称为共价结构或化学结构,它是指蛋白质中的氨基酸按照特定的排列顺序通过肽键连接起来的多肽链结构。氨基酸残基主要通过肽键连接,有些蛋白质中含有二硫键。 (二)检测方法: 二硝基氟苯(DNFB)法、丹磺酰氯法、氨肽酶法、C-末端氨基酸测定(肼解法、还原法、羧肽酶法) 二、蛋白质二级结构: (一)定义:蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架原子的相对空间位置,只涉及肽链主链的构象及链内或链间形成的氢键。并不涉及氨基酸残基侧链的构象。主要的化学键为氢键。 (二)检测方法: 构象的研究方法:X射线衍射法、核磁共振光谱法、圆二色谱CD、紫外-可见差光谱、荧光探针法、激光拉曼光谱法、红外光谱法、关联规则与遗传算法。 三、蛋白质三级结构: (一)定义:整条肽链中全部氨基酸残基的相对空间位置。即肽链中所有原子在三维空间的排布位置。主要的化学键:疏水键、离子键、二硫键、氢键和配位键稳定维系三级结构的作用。 (二)检测方法: 同源建模(比较建模SWISS-MODEL)法、穿针引线方法(折叠识别方法)、从头预测法、最速下降法、牛顿法、共轭梯度法、遗传算法、分解-结合法、离散化方法、分子动力学法、混合预测方法、粒子群优化算法(PSO)。 四、蛋白质四级结构: (一)定义:有些蛋白质分子含有二条或多条多肽链,每一条多肽链都有完整的三级结构,称为蛋白质的亚基。蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级结构。亚基之间的结合力主要是疏水作用,其次是氢键和离子键。 (二)检测方法: 线性降维法:Swiss-Prot数据库中抽取数据集进行四级结构预测。 Quat-PRE方法:综合运用mRMR方法和SVM的wrapper方法进行四级结构预测。 最近邻居算法:从蛋白质一级序列出发,利用蛋白质序列氨基酸组成、二肽组成以及混合组成方法对蛋白质单聚体、二聚体、三聚体、四聚体、五聚体、六聚体和八聚体进行分类研究。

生物化学知识点与题目 第四章 蛋白质化学.

第四章蛋白质化学 知识点: 一、氨基酸 蛋白质的生物学功能 氨基酸:酸水解:破坏全部色氨酸以及部分含羟基氨基酸。碱水解:所有氨基酸产生外消旋。氨基酸的分类:非极性氨基酸(8种):Ala、V al、Leu、Ile、Pro、Met、Phe、Trp;极性氨基酸(12种):带正电荷氨基酸Lys、Arg、His;带负电荷氨基酸Asp和Glu;不带电荷氨基酸Ser、Thr、Tyr、Asn、Gln、Cys、Gly。 非蛋白质氨基酸: 氨基酸的酸碱性质: 氨基酸的等电点,氨基酸的可解离基团的pK值,pI的概念及计算, 高于等电点的任何pH值,氨基酸带有净负电荷,在电场中将向正极移动。 氨基酸的光吸收性:芳香族侧链有紫外吸收,280nm, 氨基酸的化学反应:α-氨基酸与水合茚三酮试剂共热,可发生反应,生成蓝紫化合物。茚三酮与脯氨酸和羟脯氨酸反应则生成黄色化合物。 二、结构与性质 肽:基本概念;肽键;肽;氨基酸残基;谷胱甘肽;肽键不能自由转动,具有部分双键性质;肽平面 蛋白质的分子结构:一级结构,N-末端分析,异硫氰酸苯酯法;C-末端分析,肼解法 蛋白质的二级结构:是指蛋白质分子中多肽链骨架的折叠方式,包括α螺旋、β折叠和β转角等。 超二级结构:超二级结构是指二级结构的基本结构单位(α螺旋、β折叠等)相互聚集,形成有规律的二级结构的聚集体。 结构域: 蛋白质的三级结构:蛋白质的三级结构指多肽链中所有氨基酸残基的空间关系,其具有二级结构或结构域。 球状蛋白质分子的三级结构特点:大多数非极性侧链(疏水基团)总是埋藏在分子内部,形成疏水核;大多数极性侧链(亲水基团),总是暴露在分子表面,形成一些亲水区。 蛋白质的四级结构:蛋白质的四级结构是由两条或两条以上各自独立具有三级结构的多肽链(亚基)通过次级键相互缔合而成的蛋白质结构。变构蛋白、变构效应;血红蛋白氧合曲线。维持蛋白质分子构象的化学键:氢键,疏水键,范德华力,盐键,二硫键等 三、蛋白质的分子结构与功能的关系 蛋白质的分子结构与功能的关系:一级结构决定高级结构,核糖核酸酶的可逆变性;变性、复性、镰刀型红细胞贫血症的生化机理; 四、蛋白质的性质及分离纯化 胶体性质:双电层,水化层;1. 透析;2. 盐析;3. 凝胶过滤; 酸碱性质:1. 等电点沉淀;2. 离子交换层析;3. 电泳 蛋白质的变性:蛋白质变性后,二、三级以上的高级结构发生改变或破坏,但共价键不变,一级结构没有破坏。

生物化学蛋白质的结构与功能试题及答案

第一章蛋白质的结构与功能 [测试题] 一、名词解释:1.氨基酸 2.肽 3.肽键 4.肽键平面 5.蛋白质一级结构 6.α-螺旋 7.模序 8.次级键 9.结构域 10.亚基 11.协同效应 12.蛋白质等电点 13.蛋白质的变性 14.蛋白质的沉淀 15.电泳 16.透析 17.层析 18.沉降系数 19.双缩脲反应 20.谷胱甘肽 二、填空题 21.在各种蛋白质分子中,含量比较相近的元素是____,测得某蛋白质样品含氮量为15.2克,该样品白质含量应为____克。 22.组成蛋白质的基本单位是____,它们的结构均为____,它们之间靠____键彼此连接而形成的物质称为____。 23.由于氨基酸既含有碱性的氨基和酸性的羧基,可以在酸性溶液中带____电荷,在碱性溶液中带____电荷,因此,氨基酸是____电解质。当所带的正、负电荷相等时,氨基酸成为____离子,此时溶液的pH值称为该氨基酸的____。 24.决定蛋白质的空间构象和生物学功能的是蛋白质的____级结构,该结构是指多肽链中____的排列顺序。25.蛋白质的二级结构是蛋白质分子中某一段肽链的____构象,多肽链的折叠盘绕是以____为基础的,常见的二级结构形式包括____,____,____和____。 26.维持蛋白质二级结构的化学键是____,它们是在肽键平面上的____和____之间形成。 27.稳定蛋白质三级结构的次级键包括____,____,____和____等。 28.构成蛋白质的氨基酸有____种,除____外都有旋光性。其中碱性氨基酸有____,____,____。酸性氨基酸有____,____。 29.电泳法分离蛋白质主要根据在某一pH值条件下,蛋白质所带的净电荷____而达到分离的目的,还和蛋白质的____及____有一定关系。 30.蛋白质在pI时以____离子的形式存在,在pH>pI的溶液中,大部分以____离子形式存在,在pH

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具 (南京农业大学生命科学学院生命基地111班) 摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。 关键词:蛋白质;结构预测;跨膜域;保守结构域 1 蛋白质相似性检测 蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。 表一常用蛋白质数据库 网址可能有更新 氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。 序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

蛋白质结构预测在线软件

蛋白质预测在线分析常用软件推荐 蛋白质预测分析网址集锦 物理性质预测: Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemasshttp://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://https://www.docsj.com/doc/9c11698361.html,/pub/fasta/ SAPS http://ulrec3.unil.ch/software/SAPS_form.html 基于组成的蛋白质识别预测 AACompIdent http://expaxy.hcuge.ch ... htmlAACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.e mbl-heidelberg.de/prs.html 二级结构和折叠类预测 nnpredict https://www.docsj.com/doc/9c11698361.html,/~nomi/nnpredict Predictprotein http://www.embl-heidel ... protein/SOPMA http://www.ibcp.fr/predict.html SSPRED http://www.embl-heidel ... prd_info.html 特殊结构或结构预测 COILS http://ulrec3.unil.ch/ ... ILS_form.html MacStripe https://www.docsj.com/doc/9c11698361.html,/ ... acstripe.html 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。 由NCBI检索蛋白质序列 可联网到:“http://www.ncbi.nlm.ni ... gi?db=protein”进行检索。 利用SRS系统从EMBL检索蛋白质序列 联网到:https://www.docsj.com/doc/9c11698361.html,/”,可利用EMBL的SRS系统进行蛋白质序列的检索。 通过EMAIL进行序列检索 当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。 蛋白质基本性质分析 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的

蛋白质提取与制备的原理和方法

蛋白质提取与制备的原理和方法 蛋白质提取与制备蛋白质种类很多,性质上的差异很大,既或是同类蛋白质,因选用材料不同,使用方法差别也很大,且又处于不同的体系中,因此不可能有一个固定的程序适用各类蛋白质的分离。但多数分离工作中的关键部分基本手段还是共同的,大部分蛋白质均可溶于水、稀盐、稀酸或稀碱溶液中,少数与脂类结合的蛋白质溶于乙醇、丙酮及丁醇等有机溶剂中。因此可采用不同溶剂提取、分离及纯化蛋白质和酶。 蛋白质与酶在不同溶剂中溶解度的差异,主要取决于蛋白分子中非极性疏水基团与极性亲水基团的比例,其次取决于这些基团的排列和偶极矩。故分子结构性质是不同蛋白质溶解差异的内因。温度、pH、离子强度等是影响蛋白质溶解度的外界条件。提取蛋白质时常根据这些内外因素综合加以利用。将细胞内蛋白质提取出来。并与其它不需要的物质分开。但动物材料中的蛋白质有些可溶性的形式存在于体液(如血浆、消化硫等)中,可以不必经过提取直接进行分离。蛋白质中的角蛋白、胶原及丝蛋白等不溶性蛋白质,只需要适当的溶剂洗去可溶性的伴随物,如脂类、糖类以及其他可溶性蛋白质,最后剩下的就是不溶性蛋白质。这些蛋白质经细胞破碎后,用水、稀盐酸及缓冲液等适当溶剂,将蛋白质溶解出来,再用离心法除去不溶物,即得粗提取液。水适用于白蛋白类蛋白质的抽提。如果抽提物的pH用适当缓冲液控制时,共稳定性及溶解度均能增加。如球蛋白 类能溶于稀盐溶液中,脂蛋白可用 稀的去垢剂溶液如十二烷基硫酸钠、洋地黄皂苷(Digitonin)溶液或有机溶剂来抽提。其它不溶于水的蛋白质通常用稀碱溶液抽提。 蛋白质类别和溶解性质 白蛋白和球蛋白: 溶于水及稀盐、稀酸、稀碱溶液,可被50%饱和度硫酸铵析出。 真球蛋白: 一般在等电点时不溶于水,但加入少量的盐、酸、碱则可溶解。 拟球蛋白: 溶于水,可为50%饱和度硫酸铵析出 醇溶蛋白: 溶于70~80%乙醇中,不溶于水及无水乙醇 壳蛋白: 在等电点不溶于水,也不溶于稀盐酸,易溶于稀酸、稀碱溶液 精蛋白: 溶于水和稀酸,易在稀氨水中沉淀 组蛋白: 溶于水和稀酸,易在稀氨水中沉淀 硬蛋白质: 不溶于水、盐、稀酸及稀碱 缀合蛋白(包括磷蛋白、粘蛋白、糖蛋白、核蛋白、脂蛋白、血红蛋白、金属蛋白、黄素蛋白和氮苯蛋白等) : 此类蛋白质溶解性质随蛋白质与非蛋白质结合部分的不同而异,除脂蛋白外,一般可溶于稀酸、稀碱及盐溶液中,脂蛋白如

蛋白质部分的练习题参考答案剖析

第一部分填空 1、蛋白质多肽链中的肽键通过一个氨基酸的羧基和另一氨基酸的氨基连接而形成。 2、稳定蛋白质胶体的因素是水化层和双电层。 3、当氨基酸溶液的pH=pI时,氨基酸为___离子形式,当pH>pI时,氨基酸为____离子形式。兼性离子,阴离子 4、球状蛋白质中有_____侧链的氨基酸残基常位于分子表面而与水结合,而有_______侧链的氨基酸位于分子的内部。亲水,疏水 5、今有甲、乙、丙三种蛋白质,它们的等电点分别为8.0、4.5和10.0,当在pH8.0缓冲液中,它们在电场中电泳的情况为:甲_______,乙_______,丙________。不移动,向正极,向负极 6、加入低浓度的中性盐可使蛋白质溶解度________,这种现象称为________,而加入高浓度的中性盐,当达到一定的盐饱和度时,可使蛋白质的溶解度______,这种现象称为_______。增加,盐溶,降低,盐析 7、蛋白质变性主要是其________ 结构遭到破坏,而其______ 结构仍可完好无损。高级,一级 8、当氨基酸溶液的pH=pI时,氨基酸为_______离子形式;当pH>pI时,氨基酸为_______离子形式。两性,负电 9、皮肤遇茚三酮试剂变成___________颜色,是因为皮肤中含有___________所致。蓝紫色,蛋白质 10、蛋白质中氨基酸的主要连接方式是肽键_。 11、蛋白质脱氨基的主要方式有_氧化脱氨基作用、联合脱氨基作用和嘌呤核苷酸循环。 12、蛋白质中因含有、和,所以在280nm处有吸收。色氨酸,酪氨酸,苯丙氨酸 13、蛋白质的二级结构主要有____、____、β-转角和无规卷曲等四种形式,维持蛋白质二级结构的力主要是____。α-螺旋,β-折叠,氢键 14、除脯氨酸以外,氨基酸与水合茚三酮反应产物的颜色是蓝紫色。 15、组成蛋白质分子的碱性氨基酸有_______,______和___ _ 。酸性氨基酸有 _____和 ______。赖氨酸,精氨酸,组氨酸;天冬氨酸,谷氨酸 16、氨基酸在等电点时,主要以离子形式存在,在pH>pI的溶液中,大部分以离子形式存在,在pH

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据 库,目前这二个数据库在EMBL和GenBank数据库上均建 立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序 列,这些序列经过检验和注释。该数据库主要由日内瓦大 学医学生物化学系和欧洲生物信息学研究所(EBI)合作维 护。SWISS-PROT的序列数量呈直线增长。 2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即 进行注释需要时间。一大批含有开放阅读 了解决这一问题,TrEMBL(Translated E 白质数据库,它包括了所有EMBL库中的 质序列数据源,但这势必导致其注释质量 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金 会(National Biomedical Research Foundation, NBRF) 收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database日本国家蛋 白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息 中心)合作,共同收集和维护PIR数据库。PIR根据注释 程度(质量)分为4个等级。 4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss I 质分析专家系统(Expert protein anal 据库。 网址:https://www.docsj.com/doc/9c11698361.html, 我国的北京大学生物信息中心(www.cbi.

蛋白质四级结构

四、蛋白质四级结构 1、二级结构 ·参与肽键的6个原子C1,C,O,N,H,C2位于同一平面。 C-N键不同于单键有40%双键性质。 (1)α-螺旋 ·螺旋方向为顺时针走向·每3.6个氨基酸上升一圈 ·维持因素为氢键·螺距为0.54nm ·肽键的N-H键与第4个肽键的羰基氧形成H键与轴平行。 脯氨酸无法形成氢键而不存在于α。 (2)β-折叠 ·分子内相距较远的两个肽段可通过折叠形成相同或通过回折形成走向。·肽链间肽键羰基氧和亚氨基氢形成氢键而稳固β-折叠结构。 (3)β-转角 ☆由4个氨基酸残基组成,1残基的C=O与4残基的N-H形成氢键。 而第二残基常为脯氨酸。 (4)无规卷曲:不是没有规则的随意变化,而是规律未确定的肽链结构。☆模体:蛋白质分子中具有特定空间构象与特定功能的结构成分。 超二级结构:几个二级结构结合成的有规则的二级结构组合。 2、三级结构 (1)整条肽链中全部氨基酸残基的相对空间位置。

(2)次级键:疏水键(主要)、离子键、氢键、范德华力。 (3)结构域:蛋白质上折叠成的多个结构较紧密且稳定的区域,并各行其功能。 (4)☆分子伴侣:辅助一级结构是合成中的蛋白质折叠为正确空间构象的蛋白。 ·只有在特定条件下,一级结构决定高级结构,高级结构再决定生物学功能。 3、四级结构 亚基间以非共价键相连接 结合力:氢键、离子键驱动力:疏水键 每个亚基均有三级结构,但无生物学功能。 ·同二聚体·异二聚体 五、蛋白质结构与功能 1、一级结构 (1)一级结构是空间构想基础,只要一级结构未破坏,就有可能恢复至原来三级结构。 (2)一级结构相似的蛋白有相似的高级功能 (3)物种越相近,一级结构越相似。 (4)重要氨基酸残基缺失替代,会严重影响构想及生理功能而引起疾病。 2、特定空间结构 ·血红素:Fe2+含6个配位键,4个与卟啉环4个N相连,第5个:肽链中F8组氨基酸残基还与Fe2+配位结合,则血红素辅基可与蛋白质部分结合稳定。 第6个:与O结合 ·血红蛋白α2β2(每个亚基结合一个血红素携带一个O,共携带4个O。 141*2+146*2=574,共574个残基。 ·α1结合O→α2→β1→β2 正协同 ┖别构 ☆协同效应:一个亚基与配体(如O2)结合后,能影响此寡聚体中另一亚基与配体的结合能力。促进→正协同、抑制→负协同

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测:? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到:“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

蛋白质结构

四级结构(quaternary structure) 四级结构是指在亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间结构。四级结构的蛋白质中每个球状蛋白质称为亚基,亚基通常由一条多肽链组成,有时含两条以上的多肽链,单独存在时一般没有生物活性。亚基有时也称为单体(monomer),仅由一个亚基组成的并因此无四级结构的蛋白质如核糖核酸酶称为单体蛋白质,由两个或两个以上亚基组成的蛋白质统称为寡聚蛋白质,多聚蛋白质或多亚基蛋白质。多聚蛋白质可以是由单一类型的亚基组成,称为同多聚蛋白质或由几种不同类型的亚基组成称为杂多聚蛋白质。对称的寡居蛋白质分子可视为由两个或多个不对称的相同结构成分组成,这种相同结构成分称为原聚体或原体(protomer)。在同多聚体中原体就是亚基,但在杂聚体中原体是由两种或多种不同的亚基组成。 蛋白质的四级结构涉及亚基种类和数目以及各亚基或原聚体在整个分子中的空间排布,包括亚基间的接触位点(结构互补)和作用力(主要是非共价相互作用)。大多数寡聚蛋白质分子中亚基数目为偶数,尤以2和4为多;个别为奇数,如荧光素酶分子含3个亚基。亚基的种类一般是一种或两种,少数的多于两种。 亚基的立体排布 稳定四级结构的作用力与稳定三级结构的没有本质区别。亚基的二聚作用伴随着有利的相互作用包括范徳华力,氢键,离子键和疏水作用还有亚基间的二硫键。亚基缔合的驱动力主要是疏水作用,因亚基间紧密接触的界面存在极性相互作用和疏水作用,相互作用的表面具有极性基团和

疏水基团的互补排列;而亚基缔合的专一性则由相互作用的表面上的极性基团之间的氢键和离子键提供。 血红蛋白的四级结构 血红蛋白分子就是由二个由141个氨基酸残基组成的α亚基和二个由146个氨基酸残基组成的β亚基按特定的接触和排列组成的一个球状蛋白质分子,每个亚基中各有一个含亚铁离子的血红素辅基。四个亚基间靠氢键和八个盐键维系着血红蛋白分子严密的空间构象。 蛋白质--名词辨析 蛋白质一级结构(primary structure): 氨基酸序列。 蛋白质二级结构(secondary structure): 蛋白质主干原子间形成的二面角Φ(phi)和φ(psi)以及主链 上原子间形成的氢键决定的,在某些情况下,这些二面角和

最经典总结-蛋白质的结构和功能

考点二蛋白质的结构和功能(5年6考) 1.蛋白质的结构及其多样性 (1)氨基酸的脱水缩合 ①过程:一个氨基酸分子中的氨基(—NH2)和另一个氨基酸分子中的羧基(—COOH)相连接,同时脱去一分子水。 ②二肽形成示例 ③肽键:连接两个氨基酸分子的化学键可表示为—CO—NH—。 (2)蛋白质的结构层次 ①肽的名称确定:一条多肽链由几个氨基酸分子构成就称为几肽。 ②H2O中各元素的来源:H来自—COOH和—NH2,O来自—COOH。 ③一条肽链上氨基数或羧基数的确定:一条肽链上至少有一个游离的氨基和一个游离的羧基,分别位于肽链的两端;其余的氨基(或羧基)在R基上。 (3)蛋白质的结构多样性与功能多样性

■助学巧记 巧用“一、二、三、四、五”助记蛋白质的结构与功能 2.氨基酸脱水缩合与相关计算 (1)蛋白质相对分子质量、氨基酸数、肽链数、肽键数和失去水分子数的关系 ①肽键数=失去水分子数=氨基酸数-肽链数; ②蛋白质相对分子质量=氨基酸数目×氨基酸平均相对分子质量-脱去水分子数×18。(不考虑形成二硫键) 肽链 数目 氨基 酸数 肽键 数目 脱去水 分子数 多肽链相 对分子量 氨基 数目 羧基 数目1条m m-1 m-1 am-18(m-1) 至少1个至少1个n条m m-n m-n am-18(m-n) 至少n个至少n个注:氨基酸平均分子质量为a。 (2)蛋白质中游离氨基或羧基数目的计算 ①至少含有的游离氨基或羧基数=肽链数×1。 ②游离氨基或羧基数目=肽链数×1+R基中含有的氨基或羧基数。

(3)利用原子守恒法计算肽链中的原子数 ①N原子数=肽键数+肽链数+R基上的N原子数=各氨基酸中N原子总数。 ②O原子数=肽键数+2×肽链数+R基上的O原子数=各氨基酸中O原子总数-脱去水分子数。 1.在分泌蛋白的合成、加工、运输和分泌的过程中,用含35S标记的氨基酸作为原料,则35S存在于图示①~④中的哪个部位? 提示35S存在于氨基酸的R基上,题图中①处是R基,②处是肽键,③处连接的是肽键或羧基,④处连接的是碳原子,故35S存在于①部位。 2.蛋白质是生命活动的主要承担者,在组成细胞的有机物中含量最多。下图为有关蛋白质分子的简要概念图,请思考: (1)图示a中一定具有S吗? (2)图示①为何种过程?该过程除产生多肽外,还会产生何类产物? (3)图中b、c、d内容是什么?请写出b、c的化学表达式。 (4)甲硫氨酸的R基是—CH2—CH2—S—CH3,则它的分子式是________? 提示(1)不一定。 (2)①为“脱水缩合”过程,该过程还可产生H2O。 (3)b、c、d依次为“氨基酸”、“肽键”、“蛋白质功能多样性”; b的化学表达式为 c的化学表达式为—CO—NH—。 (4)氨基酸共性部分为C2H4O2N,则甲硫氨酸分子式为C2+3H4+7O2NS即

蛋白质结构预测方法综述

蛋白质结构预测方法综述 卜东波陈翔王志勇 《计算机不能做什么?》是一本好书,其中文版序言也堪称佳构。在这篇十余页的短文中,马希文教授总结了使用计算机解决实际问题的三步曲,即首先进行形式化,将领域相关的实际问题抽象转化成一个数学问题;然后分析问题的可计算性;最后进行算法设计,分析算法的时间和空间复杂度,寻找最优算法。 蛋白质空间结构预测是很有生物学意义的问题,迄今亦有很多的工作。有意思的是,其中一些典型工作恰恰是上述三步曲的绝好示例,本文即沿着这一路线作一总结,介绍于后。 1 背景知识 生物细胞种有许多蛋白质(由20余种氨基酸所形成的长链),这些大分子对于完成生物功能是至关重要的。蛋白质的空间结构往往决定了其功能,因此,如何揭示蛋白质的结构是非常重要的工作。 生物学界常常将蛋白质的结构分为4个层次:一级结构,也就是组成蛋白质的氨基酸序列;二级结构,即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等;三级结构,即二级结构在更大范围内的堆积形成的空间结构;四级结构主要描述不同亚基之间的相互作用。 经过多年努力,结构测定的实验方法得到了很好的发展,比较常用的有核磁共振和X光晶体衍射两种。然而由于实验测定比较耗时和昂贵,对于某些不易结晶的蛋白质来说不适用。相比之下,测定蛋白质氨基酸序列则比较容易。因此如果能够从一级序列推断出空间结构则是非常有意义的工作。这也就是下面的蛋白质折叠问题: 1蛋白质折叠问题(Protein Folding Problem) 输入: 蛋白质的氨基酸序列

输出: 蛋白质的空间结构 蛋白质结构预测的可行性是有坚实依据的。因为一般而言,蛋白质的空间结构是由其一级结构确定的。生化实验表明:如果在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构,整个过程在不到1秒种内即可完成。因此有理由认为对于大部分蛋白质而言,其空间结构信息已经完全蕴涵于氨基酸序列中。从物理学的角度讲,系统的稳定状态通常是能量最小的状态,这也是蛋白质预测工作的理论基础。 2 蛋白质结构预测方法 蛋白质结构预测的方法可以分为三种: 同源性(Homology )方法:这类方法的理论依据是如果两个蛋白质的序列比较相似,则其结构也有很大可能比较相似。有工作表明,如果序列相似性高于75%,则可以使用这种方法进行粗略的预测。这类方法的优点是准确度高,缺点是只能处理和模板库中蛋白质序列相似性较高的情况。 从头计算(Ab initio ) 方法:这类方法的依据是热力学理论,即求蛋白质能量最小的状态。生物学家和物理学家等认为从原理上讲这是影响蛋白质结构的本质因素。然而由于巨大的计算量,这种方法并不实用,目前只能计算几个氨基酸形成的结构。IBM 开发的Blue Gene 超级计算机,就是要解决这个问题。 穿线法(Threading )方法:由于Ab Initio 方法目前只有理论上的意义,Homology 方法受限于待求蛋白质必需和已知模板库中某个蛋白质有较高的序列相似性,对于其他大部分蛋白质来说,有必要寻求新的方法。Threading 就此应运而生。 以上三种方法中,Ab Initio 方法不依赖于已知结构,其余两种则需要已知结构的协助。通常将蛋白质序列和其真实三级结构组织成模板库,待预测三级结构的蛋白质序列,则称之为查询序列(query sequence)。 3 蛋白质结构预测的Threading 方法 Threading 方法有三个代表性的工作:Eisenburg 基于环境串的工作、Xu Ying 的Prospetor 和Xu Jinbo 、Li Ming 的RAPTOR 。 Threading 的方法:首先取出一条模版和查询序列作序列比对(Alignment),并将模版蛋白质与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。比对的过程是在我们设计的一个能量函数指导下进行的。根据比对结果和得到的查询序列的空间坐标,通过我们设计的能量函数,得到一个能量值。将这个操作应用到所有的模版上,取能量值最低的那条模版产生的查询序列的空间坐标为我们的预测结果。 需要指出的是,此处的能量函数却不再是热力学意义上的能量函数。它实质上是概率的负对数,即 ,我们用统计意义上的能量来代替真实的分子能量,这两者有大致相同的形式。 p E log ?=如果沿着马希文教授的观点看上述工作 ,则更有意思:Eisenburg 指出如果仅仅停留在简单地使用每个原子的空间坐标(x,y,z)来形式化表示蛋白质空间结构,则难以进一步深入研究。Eisenburg 创造性地使用环境串表示结构,从而将结构预测问题转化成序列串和环境串之间的比对问题;其后,Xu Ying 作了进一步发展,将蛋白质序列表示成一系列核(core )组成的序列,Core 和Core 之间存在相互作用。因此结构就表示成Core 的空间坐标,以及Core 之间的相互作用。在这种表示方法的基础上,Xu Ying 开发了一种求最优匹配的动态规划算法,得到了很好的结果。但是由于其较高的复杂度,在Prospetor2上不得不作了一些简化;Xu Jinbo 和Li Ming 很漂亮地解决了这个问题,将求最优匹配的过程表示成一个整数规划问题,并且证明了一些常用

蛋白质结构预测

实习 5 :蛋白质结构预测 学号20090***** 姓名****** 专业年级生命生技**** 实验时间2012.6.21 提交报告时间2012.6.21 实验目的: 1.学会使用GOR和HNN方法预测蛋白质二级结构 2.学会使用SWISS-MODEL进行蛋白质高级结构预测 实验内容: 1.分别用GOR和HNN方法预测蛋白质序列的二级结构,并对比异同性。 2.利用SWISS-MODEL进行蛋白质的三级结构预测,并对预测结果进行解释。 作业: 1. 搜索一条你感兴趣的蛋白质序列,分别用GOR和HNN进行二级结构预测,解释预测结果,分析两个方法结果有何异同。 答:所选用蛋白质序列为>>gi|390408302|gb|AFL70986.1| gag protein, partial [Human immunodeficiency virus] (1)GOR预测结果: 图1 图1是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为: 1到9位个氨基酸为无规卷曲,10到33位氨基酸为α螺旋,34到37位为β折叠,38到45位为无规卷曲,46到49位为α螺旋,50到53位为无规卷曲,54到65为α螺旋,66到72位为无规卷曲,73到95位为α螺旋,96到101位为无规卷曲,102到108为β折叠,109到115位为无规卷曲,117位为β折叠。 图2 图2为各种结构在序列中所占的比例,其中Alpha helix占53.85%,Extended strand占11.11%,Random coil占35.04%,无他二级结构。

图3 图3为各个氨基酸在序列中的状态以及二级结构在全序列中二级结构分布情况。 (2)HNN预测: 图4 图4是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为: 1到6位个氨基酸为无规卷曲,7到34位氨基酸为α螺旋,35到37位为β折叠,38位为α螺旋,39到44位为无规卷曲,45到49位为α螺旋,50到55位为无规卷曲,56到65为α螺旋,66到71位为无规卷曲,72到83位为α螺旋,84到86位为无规卷曲,87到95位为α螺旋,96到102为无规卷曲,103到108位为β折叠,108到117位为无规卷曲。 图5 图5为各种结构在序列中所占的比例,其中Alpha helix占55.56%,Extended strand占7.69%,Random coil占36.75%,无他二级结构。

相关文档