在高等生物中,很多的重要性状都为数量形状,比如农作物的产量,人类复杂疾病(高血液,糖尿病)等等。对于这些数量性状而言,往往受到多个基因的调控作用。为了更好的开展复杂性状的遗传学研究,挖掘调控复杂性状的相关基因,QTL技术应运而生。
QTL全称如下
quantitative trait lici
称之为数量性状基因定位,该技术的目的是定位控制数量性状的主效基因在染色体上的位置。该技术首先利用合适的作图群体和分子标记,构建高密度的遗传连锁图谱,然后在遗传图谱上定位对应的主效基因。该方法依赖作图群体,遗传图谱,分析方法等多种因素, 定位到的QTL区域往往包含许多候选基因,后续还需结合其他技术进一步进行精细定位。
eQTL全程如下
expression quantitative trait loci
称之为表达定量性状基因座位, 其概念建立在QTL的基础上,只不过将表型换成了基因的表达量,定位基因组中控制mRNA表达水平的基因座, 采用的分子标记为SNP。利用基因分型和转录组分析结果,可以快速的进行eQTL分析。
eQTL可以分为以下两类
- cis-eQTL, 也称之为local eQTL,顺式eQTL
- trans-eQTL, 也称之为distant eQTL, 反式eQTL
示意图如下
cis-eQTL指的是eQTL定位在调控基因自身所在区域,比如基因的启动子区或者编码区。当位于基因启动子区时,可能引起转录因子结合位点的改变或者染色质结构的变化,从而影响基因表达;当位于基因编码区时,会导致编码蛋白发生变化,从而影响自身基因的表达。
trans-eQTL指的是eQTL距离调控基因非常远,大于20Mb以上,甚至不在同一条染色体上。反式eQTL可能的作用模式是通过诸如转录因子等调控蛋白来来介导靶标目的基因的表达,比如上图所示的SNP X位点,位于GeneA的启动子区,SNP X对基因A而言为cis-eQTL, SNP X通过调控基因A产生的转录因子, 从而影响转录因子A的靶标基因B, 对于基因B而言,SNP X为trans-eQTL。
和基因表达与调控类似,科学家发现eQTL是具有人群,组织,细胞特异性的,不同组织或者细胞中eQTL是不尽相同的。
通过NGS和芯片技术,可以快速得到大量样本的基因分型和定量结果。基于以上两种结果,可以开展eQTL研究。
eQTL的核心算法是线性回归,和GWAS中的线性回归类似,只不过将基因表达量作为因变量。目前也有很多eQTL研究的工具和数据库,后续会详细介绍。