看到了一个蛮有意思的概念;Tumor Specifically Expressed, Evolutionarily New (TSEEN) genes
来源于2019的文章:《Oncogenes, tumor suppressor and differentiation genes represent the oldest human gene classes and evolve concurrently》,链接是:https://www.nature.com/articles/s41598-019-52835-w
提到了:虽然癌基因、抑癌基因和分化基因是人类最古老的基因类别,但是它们的进化同时发生。作者假设进化上年轻的新基因应该在肿瘤中特别表达,并且证实了这个假说,最典型的就是cancer/testis genes ,作者建议把这一类基因称作是:Tumor Specifically Expressed, Evolutionarily New (TSEEN) genes,而且认为TSEEN 基因可能成为最好的肿瘤标志物。
作者收集整理了如下所示8类基因:
- The Human Protein Atlas (housekeeping genes)
- Tumor-Associated Gene database (TAG database) (oncogenes)
- TSGene (tumor suppressor genes)
- CTDatabase (cancer/testis (CT) antigen genes)
- HomeoDB (HomeoBox genes)
- DeathBase (apoptosis genes)
- GeneOntology (differentiation genes)
- Biomedical Center Database (BMC GSTSE protein-coding genes and BMC GSTSE non-coding sequences).
中文是:人类蛋白质图谱(管家基因)、肿瘤相关基因数据库(癌基因)、 TSGene (肿瘤抑制基因)、 CTDatabase (癌症/睾丸(CT)抗原基因)、 HomeoDB (同源盒基因)、 DeathBase (凋亡基因)、分化基因(差异基因)、生物医学中心数据库(BMC GSTSE 蛋白编码基因和 BMC GSTSE 非编码序列)
下面我们一一介绍这8类基因:
- Housekeeping genes are 7367 genes expressed in all analyzed tissues
- TAG 数据库(肿瘤相关基因数据库)(245个致癌基因)被设计用于利用来自特征明显的致癌基因和肿瘤抑制基因的信息来促进癌症研究。
- TSGene 2.0数据库包含1217个人类肿瘤抑制基因(1018个编码基因和199个非编码基因) ,基于接近6000篇pubmed文献整理得到的。
- Differentiation genes (3697 genes) were obtained by manual search for “differentiation” in the Gene Ontology 数据库。
- 同源异型盒基因数据库(HomeoDB2)(333个基因)是一个手工整理的同源盒基因数据库及其分类系统。Homeodb2包括10个动物基因组(人、鼠、鸡、蛙、斑马鱼、文昌鱼、线虫、果蝇、甲虫和蜜蜂)的所有同源盒基因座。
- 死亡基因(53个基因)是一个涉及不同细胞死亡过程的蛋白质数据库。也是人工整理,但是这个数据库最后一次更新是在2011年。
- CTdatabase (286个基因)提供了基本信息,包括基因名称和别名、 RefSeq 访问号、基因组位置、已知剪接变异、基因复制和其他家族成员。(使用了2017年的更新)
- 带注释的人类蛋白质编码基因(21694个基因)均来自于基因组版本 GRCh38
最后汇总的基因数量是;
- 人类蛋白质图谱(管家基因)-6789个基因
- TAG 数据库(致癌基因)-224个基因
- TSGene (肿瘤抑制基因)-984个基因
- 基因本体学(分化基因)-3697个基因
- 同源盒基因(HomeoDB)-231个基因
- 死亡基因(凋亡基因)-53个基因
- CTDatabase (ct 抗原基因)- 187个基因,包括109个常染色体和78个 x 染色体定位基因
- 生物医学中心数据库-60个蛋白质编码基因
- 基因组装 GRCh38(全蛋白质编码基因)-19911个基因