外显子分析课前准备---单细胞数据3'UTR长度与基因表达调控

2024-09-11 17:38:15 浏览数 (2)

作者,Evil Genius

外显子的分析课程还是要好好准备的

今日参考文章

超过一半的基因产生的转录本在3'UTR长度上存在差异,但目前的单细胞/空间分析pipeline只量化了mRNA转录本的数量,而不是长度。3 ' UTR长度由3 '端切割位点(CS)决定.

mRNA丰度和mRNA长度是两个很大程度上独立的基因调控轴,它们共同决定了蛋白质合成的数量和空间组织。

知识积累

在mRNA中,3 '非翻译区(3 ' UTR)位于编码序列终止密码子和poly(A)尾部之间。mRNA和3'UTR长度由mRNA前切割和聚腺苷化(CPA)决定,CPA机制在识别聚腺苷化信号(PAS)后启动。大约一半的人类基因使用选择性裂解和聚腺苷酸化(APA)来产生mRNA同种异构体,它们的3 ' UTR不同,但编码相同的蛋白质。此外,约25%的基因利用内含子聚腺苷酸化(IPA)信号产生具有不同最后外显子的mRNA亚型,从而产生不同的蛋白质亚型。APA是一种普遍存在的疾病失调现象。3'UTR长度的改变会影响microRNAs和RNA-binding结合蛋白结合位点的存在,并能调节mRNA的稳定性和翻译。最近,3 ' UTR已成为亚细胞质定位翻译和mRNA依赖的共翻译蛋白复合物组装的重要调节因子。

APA最初被认为是一种基因表达调控模式,其中3'UTR异构体比例的改变会导致整体基因表达的变化。然而,转录组范围内的APA研究报道,不到20%的3'UTR变化调节mRNA或蛋白质的丰度。这表明mRNA丰度和3'UTR长度可能是独立的基因输出。

  • 尽管差异基因表达分析已被广泛应用,但由于一些技术障碍,对3'UTR长度的研究仍然非常有限。
  • 基于3 '标签的单细胞RNA测序(scRNA-seq)方案可用于量化差异的3 ' UTR。

基因和3'UTR表达定量

  • 原始scRNAseq数据中开发基因和3'UTR异构体定量的计算pipeline。

scUTRquant和scUTRboot提供了从scRNA-seq数据进行3'UTR分析的工作流程

基因表达数据 3'UTR异构体计数

将基因分为单UTR基因和多UTR基因

在所有被归类为多UTR基因的基因中,发现其中五分之一的基因仅在少数细胞类型中以10%或更高的速率表达多于一个3'UTR异构体。这表明一些CS可能主要产生低表达的亚型。

基因表达和3'UTR长度是基因调控的两个独立轴

核糖体蛋白的减少引起广泛的APA改变

大多数APA变化影响较短的3'UTR异构体

这种基因组上的分析代码和转录组的风格差的真的多

代码示例在GitHub - Mayrlab/scUTRquant: Bioinformatics pipeline for single-cell 3' UTR isoform quantification

生活很好,有你更好

0 人点赞