百家秘籍

蛋白查询数据库EMBL-EBI

 

蛋白家族检索数据库:Pfam 33.1(2020年5月,18259个条目) [http://pfam.xfam.org/]。

Pfam数据库是大量蛋白质家族的集合,每个蛋白质家族都由multiple sequence alignmentshidden Markov models (HMMs)表示。

蛋白质通常由一个或多个功能区(通常称为结构域)组成。域的不同组合产生了自然界中发现的各种蛋白质。因此,鉴定蛋白质中存在的结构域可以提供对其功能的了解。

Pfam还会生成相关条目的更高级别的分组,称为“ 氏族”。氏族是Pfam条目的集合,这些条目通过序列,结构或配置文件-HMM的相似性相关。

为每个条目提供的数据均基于 UniProt参考蛋白质组, 但仍可通过输入蛋白质登录来找到有关单个UniProtKB序列的信息。通过搜索各种数据库,可以提供Pfam完全比对,以提供不同的登录名(例如,all UniProt and NCBI GI)或不同级别的冗余。


  

蛋白查询数据库EMBL-EBI

数据库输入
数据库提供了多种输入方式:

1)输入序列来进行比对查看具体是哪个蛋白家族的;

2)可以输入蛋白相关的结果:结构域;

3) 也可以通过检测词来检索符合要求的蛋白家族信息;

4)同时可以基于物种来见来查找某一物种的所有蛋白家族信息。

蛋白查询数据库EMBL-EBI

应用举例:

如果查询想要使用和凋亡相关的有哪些蛋白,就在关键词检索里面输入:apoptosis

蛋白查询数据库EMBL-EBI

由于我们这里是进行了关键词的检索,所以会出来很多相似的结果。如果靶定到一个具体的结构域上的话,那就可以直接到结果界面了。
在关键词检索完之后,我们会得到一个和这个关键词相关的表格。在这个表格当中,可以看到每一个相关家族在数据库当中都包括哪些信息。

蛋白查询数据库EMBL-EBI

以Bcl-2家族来进行结果说明。

基本家族信息汇总
在总的结果的界面,首先看到的是这个蛋白家族的基本信息,这些基本的介绍主要来自于维基百科。这里我们能看到这个蛋白家族基本的构造、功能、家族相关结构域以及可能相关的基因。

蛋白查询数据库EMBL-EBI


主要结构域汇总
由于这里能查找的一系列具有相似功能的蛋白家族,但是一个蛋白不可能只有一个结构域的情况。所以这个部分就汇总了包含bcl-2的所有的蛋白结构域情况。

蛋白查询数据库EMBL-EBI

不同物种蛋白相关进化情况
在进行基因研究的时候,我们经常要比较各个物种之间蛋白序列的保守型情况。这种比较的方式基本上是通过进化树的方式来进行实现的。所以数据库也进行了简单的进化树构建。当然这个只是基本的查看。想要构建好看的进化树数据库也提供的原始数据下载的地方,点击下载。

蛋白查询数据库EMBL-EBI

相互作用关系
蛋白与蛋白不是单独发挥作用的。所以我们经常也需要查看这些蛋白家族是和哪些蛋白有相互作用关系的。在这个部分,数据库就提供了可能相互所有的其他蛋白

蛋白查询数据库EMBL-EBI

每个物种包括的相似蛋白结构域的蛋白名称
以上都是基本的汇总,有时候我们想要知道到底哪些蛋白具有这个结构域。这个时候就可以在在结构当中查看了。这里提供了蛋白的PDB ID号。如果想要基因 名的话。就得转换一下了。

蛋白查询数据库EMBL-EBI


以上就是这个数据库的基本内容了。主要还是通过检索某一个特定结构域来获得相关的蛋白家族的信息。

 

Citing Pfam
If you find Pfam useful, please consider citing the reference that describes this work:

The Pfam protein families database in 2019: S. El-Gebali, J. Mistry, A. Bateman, S.R. Eddy, A. Luciani, S.C. Potter, M. Qureshi, L.J. Richardson, G.A. Salazar, A. Smart, E.L.L. Sonnhammer, L. Hirsh, L. Paladin, D. Piovesan, S.C.E. Tosatto, R.D. Finn
Nucleic Acids Research (2019)  doi: 10.1093/nar/gky995

资料参考:医学数据库百科

 资料啊