蛋白质数据库 - 类型和重要性|生物信息学|.微生物纸币

表的内容

蛋白质数据库的重要性

正在产生巨大的蛋白质结构，功能和特别序列的巨大数据。搜索数据库通常是研究新蛋白质的第一步。它有以下用途：

主要数据库持有从核苷酸序列的概念翻译中推断出实验确定的蛋白质序列。当然，这不是实验衍生信息，而是由于核苷酸序列信息的解释而产生，因此必须被视为可能包含误解的信息。存在许多主要蛋白质序列数据库，每个数据库都需要一些特定的考虑。

一个P。R.O.Tein信息资源（PIR） - 蛋白质序列数据库（PIR-PSD）：

湾瑞士人

其他众所周知的和广泛使用的蛋白质数据库是瑞士 - prot。与PiR-PSD一样，这种策序蛋白质序列数据库也提供了高水平的注释。
每个条目中的数据可以分别视为核心数据和注释。
核心数据包括在普通单字母氨基酸代码中输入的序列以及相关的参考和参考书目。获得序列的生物的分类也构成了该核心信息的一部分。
注释包含有关蛋白质的功能或功能的信息，翻译后修饰，例如磷酸化，乙酰化等，功能性和结构结构域和位点，例如钙结合区域，ATP结合位点，锌指状物等，已知的二次结构特征，如实施例α螺旋，β片等，蛋白质的季结构，与其他蛋白质的相似性，如果不同的作者可能出现的任何蛋白质，并且由于不同的作者出现的不同蛋白质，或由于不同蛋白质而出现的不同序列作为注释的一部分描述的不同菌株中的突变。

trembl（用于翻译的embl）是一个计算机注释的蛋白质序列数据库，作为SWISS-PROT的补充发布。它包含了EMBL核苷酸数据库中所有未被充分注释的编码序列的翻译。因此，它可能包含了从未在生物体中表达过或从未真正识别过的蛋白质序列。

c.蛋白质数据库:

二级数据库之所以被称为二级数据库，是因为它们包含了对主数据库中保存的序列的分析结果。许多二级蛋白质数据库是寻找不同蛋白质相关特征的结果。一些常用的序列和结构二级数据库如下:

一个P。ROSITE:

打印:

c。MHCPep:

MHCPEP是一种数据库，其包含已知具有13000多个肽序列，该序列结合免疫系统的主要组织相容性。
数据库中的每个条目包含不仅肽序列,这可能是8到10氨基酸长除了信息的特定的MHC分子结合,实验方法用于测定肽,活性度和亲和力,蛋白质来源,当分解时，产生了这个肽段和其他肽段，肽段上的位置，它锚定在MHC分子上，并参考和交叉链接到其他信息。

天。PFAM.

Xiong J.（2006）。基本生物信息学。德克萨斯州A＆M大学。剑桥大学出版社。
Arthur M Lesk（2014）。生物信息学介绍。牛津大学出版社。牛津，英国
https://sta.uwi.edu/fst/dms/icgeb/documents/1910NucleotideandProteinsequencedatabasesDGL3.pdfphys.1
https://www.nature.com/subjects/pricein-databases.
https://www.slideshare.net/PuneetKulyana/primary-and-secondary-databases-ppt-by-puneet-kulyana
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3265122/
https://www.rcsb.org/
https://web.warwick.ac.uk/telri/Bioinfo/MODULES/2_Molecular_Biology_Databases/2_Molecular_Biology_Databases.html

阅读也……