1.什么是GEO数据库
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心创建并维护的基因表达数据库。它收录世界各国研究机构提交的高通量基因表达数据。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。在GEO最基本的组织层面,有四种基本实体类型。前三个(样本,平台和系列)由用户提供; 第四,数据集由GEO工作人员根据用户提交的数据进行编译和策划。
文章中作者用的数据集编号,编号开头是GSE
某公司开发的一款芯片产品,在GEO中芯片开头是GPL
表达矩阵的行名是探针名,列名是样本名,所以列名编号的开头是GSM
2.GEO表达芯片的原理
用探针的表达量反应基因的表达量。
3.GEO表达芯片分析思路