一 DNA序列获取
1GenBank
GenBank
组织结构
以TIGD1基因为例
image.png
特性表
Entrez
2 EMBL的ENA数据库
EMBL_ENA
可以进行序列相似性搜索
序列相似性搜索
3 DDBJ
DDBJ
二 编码和非编码的DNA序列数据库
1 RefSeq
NCBI的参考序列数据库
The Reference Sequence (RefSeq) collection provides a comprehensive, integrated, non-redundant, well-annotated set of sequences, including genomic DNA, transcripts, and proteins. RefSeq sequences form a foundation for medical, functional, and diversity studies. They provide a stable reference for genome annotation, gene identification and characterization, mutation and polymorphism analysis (especially RefSeqGene records), expression studies, and comparative analyses
Refseq
特点:综合,非冗余,明确的核酸和蛋白质序列的对应关系,数据更新快,可靠
2 PseudoGene假基因数据库
pseudogene
3 STRBase 短串联重复序列数据库:short tandem repeat DNA internet database
已经无法打开 具体请参考文章https://www.ncbi.nlm.nih.gov/pmc/articles/PMC29767/
4 TRDB 串联重复数据库:tandem repeats databse
原作https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1781109/
TRDB
收录基因组DNA序列中串联重复序列和各种分析工具。 可以进行:
- 串联重复序列查找工具的下载,查询和过滤服务
- 基于序列相似性的重复序列聚类,多态的预测
- PCR引物的选择和数据下载