讲师:李老师
目录
- NCBI数据库
- EMBL-EBI数据库
- UCSC
- Ensembl 数据库
- 1000 Genomes (千人基因组计划)
数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。
核酸序列数据库有GenBank, EMBL, DDB等,核酸序列是了解生物体结构、功能、发育和进化的出发点。国际上权威的核酸序列数据库有三个,分别是美国生物技术信息中心(NCBI)的GenBank ,欧洲分子生物学实验室的EMBL-Bank(简称EMBL),日本遗传研究所的DDBJ
蛋白质序列数据库有SWISS-PROT, PIR,OWL, NRL3D, TrEMBL等, 蛋白质片段数据库有PROSITE, BLOCKS,PRINTS等, 三维结构数据库有PDB, NDB,BioMagResBank,CCSD等, 与蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等, 与基因组有关的数据库还有ESTdb,OMIM,GDB, GSDB等, 文献数据库有Medline, Uncover等。 另外一些公司还开发了商业数据库,如MDL等。
生物信息学数据库覆盖面广,分布分散且格式不统一, 因此一些生物计算中心将多个数据库整合在一起提供综合服务,如EBI的SRS(Sequence Retrieval System)包含了核酸序列库、蛋白质序列库,三维结构库等30多个数据库及CLUSTALW、PROSITESEARCH等强有力的搜索工具,用户可以进行多个数据库的多种查询。
通过本章内容的学习,你将学习到如何使用以上这些数据库。