最新 最热

单细胞测序—比较两个Seurat分析结果中细胞簇和细胞类型的对应关系

如果一个数据集我们采用了两种方法对其进行了分析,可采用如下方法比较两个Seurat分析结果中细胞簇和细胞类型的对应关系。

2024-08-19
1

单细胞测序—PBMC注释的细胞类型

刚开始做单细胞测序的下游分析时,常用的是官方文档提供的pbmc3K数据集,但是我对注释出来的细胞类型缺乏相应的背景知识,对单细胞测序背后的生物学意义也很模糊,这里首先对pbmc3K数据集注释出来的细胞类型进行简单的梳理。...

2024-08-15
1

转录组-样品表达总体分布及质控可视化

在拿到表达矩阵时我们常常会对其基因表达的总体分布(可选),以及质量控制进行可视化(必须)。这里总结记录相关代码。

2024-08-14
1

转录组—上游分析_如何拿到count矩阵

本文档记录GSE149638数据集中下载SRR11652578和SRR11652615原始数据

2024-08-12
1

数据开发/数仓工程师上手指南(七)CDM-DWS层搭建规范及流程

进入到了CMD公共数据层的结尾最后一层-DWS层了,该层基本就是直接与业务强关联,也就是说产品提出的需求,或是报表、用户画像统计好还是数据大屏都是在这一层给处理好数据,再放入ADS层,然后我们只需要在BI里面配备对应的数据...

2024-08-05
1

转录组分析—再谈GSEA

Gene Set Enrichment Analysis (GSEA) 是一种生物信息学方法,用于确定基因集合(gene sets)在基因表达数据中的显著性变化。它广泛应用于基因表达数据的功能解释,帮助研究者理解在特定实验条件下哪些生物学通路或功能类别...

2024-08-05
1

转录组GSE122709—KEGG 富集不出?

在分析GSE122709时候,取D1组、D2组分别与NC组进行基因差异与富集的分析时候,遇到一个问题就是D2/NC比较,进行KEGG分析时候什么结果都没有。查找原因时候遇到了一些问题,这里做简单的记录。...

2024-08-02
1

转录组GSE157718_Tpm与Count差异分析的比较

在尝试复现GSE157718数据集的时候,发现网站同时提供了表达矩阵tpm形式与count形式,因此分别用这两种形式进行基因差异与富集分析,再进行对比。

2024-08-01
1

数据开发/数仓工程师上手指南(五)CDM-DIM层搭建规范及流程

在上篇文章的进度和基础之上,我们已经算是构建好了ODS数据引入层,ODS这一层构建的比较简单,没有很多限制规范,但是CDM数据公共层可以算得上是数据仓库的主题,之前我们也将DWD数据明细层、DIM数据维度层和DWS公共汇总层都归...

2024-08-01
3

转录组分析—GSE200033二分组(去除异常值Vs未去除)

直接从GEO官网下载表达矩阵,临床信息表格(存放在Series Matrix File中),放在工作目录下;

2024-07-31
1