最新 最热

3款经典转录组测序差异分析R包的一致性如何

这个文章做了 Differentially expression analysis of GSE199152 ,这个数据集 GSE199152 (3 RA-UIP, 20 IPF-UIP patients and 4 non-UIP controls) ,然后就可视化了 DESeq2, EdgeR and Limm......

2023-09-04
1

SingleR说是NK细胞你就相信了吗

这两个方向都需要掌握基础的单细胞转录组数据集的降维聚类分群,如果这个环节有问题就会造成数据挖掘文章很尴尬,比如:2023的文章:《 Integrated analysis of single‐cell and bulk RNA‐sequencing identifies a signat...

2023-09-04
1

假如审稿人让你把单细胞数据挖掘代码上传到github

而且不得不说,github在生物信息学领域的重要性,之前我们介绍过代码海洋,详见:《代码海洋-你想模仿的这里都有啊》,比如《单细胞天地》公众号分享的文献:单细胞转录组揭示肺腺癌特有的肿瘤微环境,就是配全部的代码。也有专门...

2023-09-04
1

什么是窄表?什么是宽表?

在数据库中,窄表和宽表是两种设计思想,分别指的是列数少或者列数多的表格。

2023-09-01
1

假如审稿人让你把单细胞数据挖掘代码上传到github

而且不得不说,github在生物信息学领域的重要性,之前我们介绍过代码海洋,详见:《代码海洋-你想模仿的这里都有啊》,也有专门的github收集整理的更加齐全,而且还分门别类整理好了,详见:https://github.com/genecell/single-cell...

2023-08-31
1

Kaggle ICR 赛题 LightGBM基础思路

Kaggle ICR比赛现在在进行中,这个比赛是一个典型的数据挖掘比赛,很适合入门学习。本文将介绍现在ICR基础的解决方案。

2023-08-29
1

使用Puppeteer提升社交媒体数据分析的精度和效果

社交媒体是互联网上最受欢迎的平台之一,它们包含了大量的用户生成内容,如文本、图片、视频、评论等。这些内容对于分析用户行为、舆情、市场趋势等有着重要的价值。但是,如何从社交媒体上获取这些数据呢?一种常用的方法是...

2023-08-29
2

10招解决机器学习模型过拟合

增加更多的训练数据有助于防止过拟合,主要是因为更多的数据能够提供更全面、更准确的信息,从而使模型更好地学习数据中的真实模式。以下是一些解释:...

2023-08-18
1

Day02 生信马拉松-vector

paste0(rep("student",times = length(a)),a)

2023-08-11
1

Day03 生信马拉松-data.frame

5.3 增加新一列 e.p df1$p.value <- c(0.01,0.02,0.07,0.05)

2023-08-11
1