最新 最热

RNAseq不同测序平台比较

在前面介绍过不同测序平台的优势,目前市场上主流测序平台主要包括短读长测序的 illumina 测序平台,华大基因的 MGI 测序平台,长度长测序的 Pacbio 测序以及牛津纳米孔 nanopore 测序。在 ncbi 的 sra 数据库中,目前超过 9...

2022-10-25
1

RNAseq建库方法

当前 RNAseq 主要研究的是 mRNA,由于一次转录过程中,mRNA 只占很少一部分(约 4~5%),需要采用特殊的建库方式将 mRNA 从总 RNA 中分离出来。常用的方式有两种,一种是根据 PlolyA 尾巴进行富集,另一种是降解 rRNA 的方法。两种...

2022-10-25
1

RNAseq 简介

转录组,也叫做 RNAseq,是指特定类型细胞中全体转录本的集合。在转录组中,既包括编码蛋白的信使 RNA(mRNA),也包括不编码蛋白的 rRNA,tRNA,小RNA,lncRNA 等非编码 RNA。这些 RNA 转录本彼此协同作用,共同来调控细胞的生长,发育...

na
2022-10-25
0

关于基因的概念

在我们生物信息学分析中会涉及到非常多的概念,这些概念对于理解分析非常重要,在阅读文献中也常常会涉及到这些概念,这些概念常常让人迷

2022-10-25
0

GEO数据库简介

GEO 数据库全称是 Gene Expression Omnibus,是由美国国立生物技术信息中心NCBI 创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,目前已经发表的论文中涉及到的基因表达检测的数据可以...

2022-10-25
1

基因表达调控概述

生物体不同细胞内一般情况下具有相同的 DNA 序列,但是最终会分化为不同的细胞。例如人体内不同的组织细胞具有相同的 DNA 序列,但是分化为不同的细胞,例如血细胞,神经细胞,肌细胞等。这些都是由于基因表达调控的差别。...

2022-10-25
1

因子列表缺失数据

所有的数据集合可以分为三类,连续型,名义型和有序型。连续型例如1 2 3 4 5 8 9 10,名义型如sample1 sample2 sample3 ,而有序型 good better best;周一,周二,周三……等。在R中名义型变量和有序性变量称为因子,factor。这些分...

2022-10-25
0

数据降维以及细胞亚群分类

单细胞数据中包含很多细胞以及很多基因,是一个较大的数据集,维度较大,需要对数据进行降维。降维就是对原始数据进行特征提取,经常会得到高维度的特征向量。通过降维的方式来寻找数据内部的特性,提升特征表达能力,降低模型的...

2022-10-25
1

质控过滤以及标准化

标准处理流程:读取数据后对矩阵进行标准的处理流程,包括 QC 过滤,数据标准化以及检测差异表达的基因组。

2022-10-25
1

利用cellranger分析单细胞数据

当前的单细胞测序主要采用 illumina 测序平台进行测序,一般为双末端测序,测序完成之后首先需要对 illumina 测序数据进行质控过滤,过滤条件与其他分析类似。需要注意的是,虽然单细胞测序也是双末端测序,但是 reads1 中通常...

2022-10-25
1