Index of Bio-Database

Index of Bio-Database

Compliment Bio-database

I’ll keep updating when I used those databases. If you know more or find the update/died link on the page, please comment and I’ll update it.

我大概可能会继续更新这个页面。 如果你有建议/发现死链接/更新链接, 请告在评论区诉我我会更新的。 谢谢

  • INSD (国际核酸序列数据库)
  1. GenBank[1] (Update:06/06/20; 4.43913s)

    • 美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库。

    • 欧洲分子生物学实验室的DNA和RNA 序列库。

  2. DNA Databank of Japan (Update:06/06/20; 0.163173s)

    • DDBJ, 日本核酸数据库

    • GSDB, 由美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库

  3. TIGR DATAbase (Update:06/06/20; OutOfTime)

    • 是世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)。

包括与DNA的复制、转录、修复等有密切关系的蛋白质因子。

BioSino (Update:06/06/20; 4.282226s) – 中国自主开发的核酸序列公共数据库。

CUTG (Update:06/06/20; 0.308161s) – Codon Usage, MM子使用频度表。

EPD (123) – Eukaryotic Promotor Database, 真核生物启动子数据库

MicroSatellite (paper) (Update:06/06/20; OutOfTime) – 微衛星片段數據

dbEST (Update:06/06/20; OutOfTime) – 这是GenBank的重要组成部分,它包含若干物种的已表达的序列标记信息.

NUCLEOSOME – 数据库,收集实验测定的核小体数据,用于预测DNA中与组蛋白八聚体结合的位点.

Transcriptional Factors

A list of TF database: Gene expression regulatory sites and transcription factors

  1. JASPAR - JASPAR is a database of TF binding profiles and matrices for a wide range of eukaryotic TFs. It provides information on TF binding sites, PWMs, and DNA-binding domains.

  2. TRANSFAC(Update:06/06/20; 5.599736s) - TRANSFAC is a database of transcription factors, their binding sites, and DNA-binding domains. It also provides information on the regulatory networks of TFs and their interactions with other proteins.

  3. ENCODE - ENCODE is a project that aims to identify all functional elements in the human genome, including TF binding sites. It provides a comprehensive list of TF binding sites, regulatory networks, and gene expression data.

  4. ChIP-Atlas - ChIP-Atlas is a database of genome-wide TF binding profiles from ChIP-seq experiments. It provides information on TF binding sites, target genes, and functional annotations.

  5. Cistrome - Cistrome is a database of TF binding profiles and regulatory networks for a wide range of eukaryotic TFs. It also provides tools for analyzing and visualizing TF binding data.

TRRD (Update:06/06/20; 0.817254s) – transcription regulatory regions of eukaryotic genes, 真核生物基因组转录调控区数据库。

OOTFD (Update:06/06/20; 11.796405s) – Molecular Informatics Resource for the Analysis of Gene Expression, 转录因子和基因表达数据库

scRNA-Seq

RNA序列和核糖体数据库:

★RNAmods,RNA修饰数据库。
ftp://medlib.med.utah.edu/library/RNAmods

★PLMItRNA基于FastA的绿色植物线粒体tRNA分子和tRNA基因的数据库。
http://www.ebi.ac.uk/services/
★16SMDB、16S-likeMDB 、16SMDBexp 、23SMDB、 23S-likeMDBexp数据库,是一批16S和23S核糖体RNA突变数据库。
ftp://acad.fandm.edu/nar/

基因图谱数据库:

★Rhdb,辐射杂交数据库。
ftp://ftp.ebi.ac.uk/pub/databases/RHdb

★GDB,人类基因组数据库。
http://www.gdb.org/
ftp://ftp.gdb.org

★HuGeMap,人类基因遗传图谱和物理图谱的分布式集成数据库。
ftp://ftp.ebi.ac.uk/pub/databases/RHdb/gm99.map

人类基因组测序中心:
★HUGO是人类基因组组织的缩写。
http://hugo.gdb.org/

★英国Wellcome Trust是人类基因组计划的另一个主要资助者。
http://www.wellcome.ac.uk/

★英国的Sanger中心的人类基因组计划网页,不仅有它们负责测序的染色体数据,还有到其他染色体数据的链接。
http://www.sanger.ac.uk/HGP/

★ Sanger 中心是世界上最大的DAN测序中心之一。承担人类基因组计划的三分之一,集中在1、6、9、10、13、20、22和X。
http://www.sanger.ac.uk/HGP/stats.html

★LANL,美国洛斯阿拉莫斯国家实验室。

http://jgi.doe.gov/

★UWGC,华盛顿大学基因中心,是国际上最活跃的测序中心之一。

ftp://ftp.genome.washington.edu/

★DOGS,基因组尺寸数据库。
http://www.cbs.dtu.dk

★GenBank的/genomes/子目录:
ftp://ftp.cbi.pku.edu.cn/pub/databases/genband/genomes/

★ECDC,大肠杆菌菌株K12的基因序列库,包括基因、读框、调控区、启动子、终止子、tRNA和rRNA等。

ftp://ftp.ebi.ac.uk/pub/databases/ecdc

★NRSub,非冗余枯草芽孢杆菌DNA数据库,包括完全基因组、MM子使用表、基因图谱和基因家族。

ftp://ftplnig.ac.jp/pub/db/nrsub

★HIDB,流感嗜血菌完全基因组的原始数据库。
http://www.tigr.org:80/tdb/mdb/hidb/hidb.html

ftp://ftp.tigr.org/pub/data/h_influenzae

★MJDB,詹氏甲烷球菌基因组数据库。
ftp://ftp.tigr.org/pub/data/m_jannaschii

http://www.tigr.org/tdb/mdb/mjdb/mjdb.html

★LISTA,LISTA-HOP和LISTA-HON是酿酒酵母基因组中蛋白质编码序列及其同源性的数据库。

ftp://bioftp.unibas.ch

★FGSC,真菌遗传学信息中心。
http://www.fgsc.net/

原生生物和线虫基因组:

★ AceDB,线虫综合数据库。
ftp://sanger.ac.uk/pub/acedb

ftp://ncbi.nlm.nih.govrepository/acedb

ftp://lirmm.lirmm.fr/pub/acedb

★关于线虫发育特别是化学感觉神经的研究。

昆虫基因组:

★斯坦福大学的果蝇基因组中心。
http://www.fruitfly.org/

★MsqDB,蚊子基因数据库。
http://klab.agsci.colostate.edu/acedb/MsqDB-acedb.html

ftp://klab.agsci.colostate.edu

啮齿动物基因组(主要是有关家鼠的数据库):

★ M.Musculus基因组库。
ftp://ncbi.nlm.mih.gov/genbank/genomes/M_muslulus

★ MGD,家鼠基因组库,现在又称MGI即家鼠基因组信息库。
http://www.informatics.jax.org/mgd.html

ftp://ftp.informatics.jax.org/

细胞器数据库:

主要是线粒体和叶绿体基因的数据。
★ MitoNuc
http://megasun.bch.umontreal.ca/gobase/

拟南芥基因组:

★ MATDB,国际拟南芥基因组计划的数据汇总。
http://www.mips.biochem.mrg.de/desc/thal/

★ AtDB,拟南芥基因组数据库。

ftp://genome-ftp.stanford.edu/pub/arabidopsis

★ TAIR,拟南芥信息资源。
http://www.arabidopsis.org/

蛋白质序列数据库:

★SWISS-PROT是对数据人工审读很严格的库。
http://www.expasy.ch/sprot/

★PROSITE,由专家根据生物知识审编的SWISS-PROT蛋白质序列中有生物意义的位点、模式和轮廓的数据库。
http://www.expasy.ch/prosite/

★KIND,瑞典斯德哥尔摩生物信息中心维护的非冗余蛋白质序列库。
ftp://ftp.mbb.ki.se/pub/KIND

★ENZYME,基于命名系统的酶数据库。
http://www.expasy.ch/enzyme/

★BRENDA,这是一个内容广泛的酶的信息库。
http://www.brenda.uni-koeln.de/

★SWISS-2DPAGE,由二维聚丙烯酰胺凝胶电泳所确定的蛋白质的参考图谱数据库,包括文本和图象信息,通向其他2D-PAGE数据库的链接等。
http://www.expasy.ch/ch2d/

★HOBACGEN数据库,包含按家族组织的所有细菌的蛋白质序列,有助于从各种细菌选取同源家族,作多序列联配和构建亲缘树。
http://pbil.univ-lyon1.fr/databases/hobacgen.html

★PKR,蛋白激酶信息库。
http://www.sdsc.edu/Kinases/pkr/pkk_catalytic/pk_cat_list.html

★Wnt基因网页。

★PhosphoBase,磷酸化位点数据库。
http://www.cbs.dtu.dk/databases/PhosphoBase/

蛋白质结构和分类数据库:

★ RCSB,结构生物信息学信息学合作研究组织。
http://www.rcsb.org/

★ PDBFinder,在PDB、DSSP、HSSP、基础上建立的二级库,包含PDB序列、作者、R因子、分辨率、二级结构等。

ftp://swift/embl-heidelberg.de/pdbfinder

★ BioMagResBank简称BMRB,是关于多肽、蛋白质和核酸的核磁共振数据库。
http://www.bmrb.wisc.edu/

★ NRL-3D,三维结构已经确定的蛋白质序列库。
http://www.gdb.org/Dan/proteins/nr13d.html

★ SMART是简单模块构架搜索工具的缩写。
http://SMART.embl-heidelberg.de/

★ MMDB蛋白质分子模型数据库。
http://www.ncbi.nlm.nih.gov/Structure/

★ INFOGENE,Sanger中心计算基因组学小组维护的、各基因组测序计划所提供的序列中已知的蛋白质和预测出的基因与蛋白质的数据库。
http://genomic.sanger.ac.uk/inf/infodb.html

★ TMBase,跨膜蛋白数据库。
ftp://ulrec3.unil.ch/pub/tmbase

★ InterPro,集成的蛋白质结构域和功能位点数据库。
http://www.ebi.ac.uk/interpro/

★ PFAM高质量的蛋白质结构域家族数据库。
http://www.sanger.ac.uk/Sorfware/Wise2/

★ GLYCBASE,蛋白质糖基化位点数据库。
http://www.cbs.dtu.dk/databases/OGLYCBASE/

★ ORDB嗅觉受体蛋白质序列数据库。
http://ycmi.med.yale.edu/senselab/ordb/

★ CarbBank亦称CCSD,复杂碳水化合物结构数据库,通常与蛋白质结构数据库归在一起。
http://www.ccrc.uga.edu

★ SWISS-3DIMAGE,蛋白质三维图象和PDB浏览器。
http://www.expasy.ch/sw3d/

★ MolMovDB,耶鲁大学的生物信息学研究室维护的分子运动数据库。
http://bioinfo.mbb.yale.edu/MolMovDB/

比较基因组学和蛋白质组学数据库:
★COG直系同源聚类数据库。
http://www.ncbi.nlm.nih.gov/COG/

基因表达数据库:
★Flyview,果蝇基因表达数据库。
http://flyview.uni-muenster.de/

★Flybrain,果蝇神经系统图谱和数据库。
http://flybrain.uni-freiburg.de/

★Axeldb,非洲爪蟾基因表达数据库。
http://www.dkfz-heidelberg.de/abt0135/axeldb.html

★GXD,家鼠基因表达数据库。
http://www.informatics.jax.org/searches/gxdindex_form.html

★Collagen人类胶原数据库。
http://www.le.ac.uk//genetics/collagen/

★人类PAX2等位基因变异数据库。
http://www.hgu.mrc.ac.uk/Softdata/PAX2/

★人类PAX6等位基因突变数据库。
http://www.hgu.mrc.ac.uk/Softdata/PAX6/

★ALFRED为Allele FREquency Database 的缩写。这是由耶鲁大学K.K.Kidd实验室维护的一个针对人口多样性和DNA多态性的等位基因数据库。
http://alfred.med.yale.edu/alfred/

★KMDB由日本庆应义塾大学医学院建立的一组与人类疾病有关的基因突变数据库。
http://mutview.dmb.med.keio.ac.jp/

★KMeyeDB人类疾病和眼病基因突变人类心脏病基因突变数据库。
http://mutview.dmb.med.keio.ac.jp/mutview3/kmeyedb/

★KMearDB人类耳病基因突变数据库。
http://mutview.dmb.med.keio.ac.jp/

★KMbrainDB人类脑病基因突变数据库。
http://mutview.dmb.med.keio.ac.jp/

★KMcancerDB人类癌症基因突变数据库。
http://mutview.dmb.med.keio.ac.jp/

MTB家鼠肿瘤生物学数据库。
http://tumor.informatics.jax.org/

★CFTR,囊性纤维变跨膜调控子突变数据库。
http://genet.sickkids.on.ca/cftr/

★HIG,Anthony Nolan 骨髓和白血病基金会的人类白细胞抗体HLA住处30年前由E.A.Kabat建立的具有免疫学意义的蛋白质序列数据库。
http://www.anthonynolan.com/HIG/

★我国水稻基因组计划针对水稻的籼稻亚种。
http://www.ncgr.ac.cn/

★ WHEAT小麦基因图谱数据库。
http://wheat.pw.usda.gov/

★ILDIS国际豆科植物数据库和信息服务。
http://www.ildis.org/LegumeWeb/

基因组信息分析
1.基因组序列信息的提取和分析
dbEST
http://www.ncbi.nlm.nih.gov/dbEST/index.html
UniGene
Transcription factor database
基因组信息分析
2.功能基因组相关信息分析
NCBI
http://www.ncbi.nlm.nih.gov/
Entrez
http://www.ncbi.nlm.nih.gov/Entrez
OMIM

蛋白质组学相关信息分析
SWISS-2DPAGE
http://us.expasy.org/ch2d/
SIENA-2DPAGE
http://www.bio-mol.unisi.it/2d/2d.html
Human 2D-PAGE Databases
PROSITE
http://us.expasy.org/prosite/
PRINTS
Pfam
http://www.sanger.ac.uk/Software/Pfam/
Blocks
SWISS-PROT蛋白质序列库
http://us.expasy.org/sprot/

大分子结构模拟和药物设计生物信息分析
PDB
SCOP
http://scop.mrc-lmb.cam.ac.uk/scop/
CATH
SWISS-3DIMAGE
http://us.expasy.org/sw3d/
DSSP

PDBsum

核酸序列的预测分析

  1. 重复序列分析
    CENSOR
    http://www.girinst.org/

  2. 数据库搜索
    NCBI的BLAST
    http://www.ncbi.nlm.nih.gov/BLAST/

  3. 编码区统计特性分析:

ExPASy
http://www.expasy.ch/tools/

Tmpred
SignalP
http://www.cbs.dtu.dk/services/SignalP/
蛋白质结构和功能的预测分析蛋白质三维结构预测 :
SWISS-MODEL
http://www.expasy.ch/swissmod/SWISS-MODEL.html
PSI-BLAST
http://www.ncbi.nlm.nih.gov/BLAST/

和引用情况。
★最为方便的查询MEDLINE的方式,是通过NCBI的PubMed服务:
http://www.ncbi.nlm.nih.gov/PubMed/

★SCI是设在美国费城的科学信息研究所所提供的文献引用情况的检索服务。
http://webofscience.com/
★ 位于美国麻省的Woods Hole海洋生物研究室有一个海洋动物数据库。
http://www.mbl.edu/

★Integrated Database Retrieval Systems

★Entrez

http://gdbwww.gdb.org/default.htm
Funding for this project has been withdrawn. This valuable database will remain online, but it should be noted that no new entries will be recorded after 31st July 1998.

Metabolism Database

Lipid database:

Click me to show more The LIPID MAPS consortium has developed a number of online tools for performing tasks such as drawing lipid structures and predicting possible structures from mass spectrometry (MS) data. A simple online interface has been developed to enable an end-user to rapidly generate a variety of lipid chemical structures, along with corresponding systematic names and ontological information. The structure-drawing tools are available for six categories of lipids: (i) fatty acyls, (ii) glycerolipids, (iii) glycerophospholipids, (iv) cardiolipins, (v) sphingolipids and (vi) sterols. Within each category, the structure-drawing tools support the specification of various parameters such as chain lengths at a specific sn position, head groups, double bond positions and stereochemistry to generate a specific lipid structure. The structure-drawing tools have also been integrated with a second set of online tools which predict possible lipid structures from precursor-ion and product-ion MS experimental data. The MS prediction tools are available for three categories of lipids: (i) mono/di/triacylglycerols, (ii) glycerophospholipids and (iii) cardiolipins. The LIPID MAPS online tools are publicly available at

Reference:


  1. Wilkinson, Mark D., et al. “The FAIR Guiding Principles for scientific data management and stewardship.” Scientific data 3.1 (2016): 1-9. ↩︎

  2. Fahy, Eoin, et al. “LIPID MAPS online tools for lipid research.” Nucleic acids research 35.suppl_2 (2007): W606-W612. ↩︎

Author

Karobben

Posted on

2020-07-28

Updated on

2024-01-22

Licensed under

Comments