从此系列推送以来,小编就和大家一直在学习的路上。作为没有学高数的理科生,在跟着StatQuest视频的学习中也收获颇丰,相信大家也一样!
接着我们就来回顾一下本系列的内容,每个链接都可点击以进行跳转。本系列主要是同StatQuest全视频的章节相同,分为:统计基础部分、线性回归、logistic回归、机器学习和高通量测序5个部分,其中还穿插了一些基于R语言实现算法的小章节。
1. 统计基础
推送目录概览:
- StatQuest序言
- 直方图与统计分布
- 正态分布与中心极限定理
- 总体参数与样本估计总体参数
- 为什么除以n会低估总体方差?
- 协方差(covariance)与相关系数(1)
- 协方差(covariance)与相关系数(2)
- 从分布中抽样
- 置信区间与p值的计算
- 单尾还是双尾检验?
- 分位数与QQ图
- 概率与似然值
- 最大似然法估计正态分布参数
- 最大似然法估计指数分布参数
- 最大似然法估计二项式分布参数
- 优势、优势比为什么需要log2转换?
2. 线性回归模型
推送目录概览:
- 最小二乘法与线性回归
- 线性回归中的R方与R方显著性
- 线性回归的R实现与结果解读
- 线性回归的妙处:t检验与方差分析
- 设计矩阵(design matrices)
- 设计矩阵 in R
3.logistic回归模型
推送目录概览:
- 01 Logistic回归概览
- 02 Logistic回归中的系数解读
- 03 最大似然估计法拟合logistic回归曲线
- 04 Logistic回归:R2与P-value的计算
- 05 饱和模型与偏差计算R方与p值
- 06 R语言实现logistic回归
4.机器学习模型
鉴于此部分的内容和前部分的内容有重叠,故小编选取其中的非重叠部分进行展示。以下为本部分内容的概览:
- 01 机器学习简介
- 02 交叉验证法(cross validation)
- 03 混淆矩阵(confusion matrix)
- 04 ROC和AUC
- 05 pROC包绘制ROC
- 06 偏差与方差(Bias and Variance)
- 07 正则化(1):通俗易懂的岭回归
- 08 正则化(2):与岭回归相似的 Lasso 回归
- 09 正则化(3):弹性网络回归
- 10 正则化(4):glmnet包实现正则化
- 11 主成分分析(PCA)原理精讲
- 12 关于PCA的建议
- 13 线性判别分析总览
- 14 t-SNE原理总览
- 15 层次聚类概览(Hierarchical Clustering)
- 16 K均值聚类原理概览(K-means clustering)
- 17 K近邻算法原理概览(K-nearest neighbors(KNN))
- 18 决策树(1): 总览
- 19 决策树(2):特征选择和缺失值处理
- 20 回归树(Regression Trees)概览
- 21 回归树剪枝:代价复杂度剪枝
- 22 随机森林概览:创建,使用和评估
- 23 支持向量分类器与支持向量机
5.高通量测序
- 01 RNA测序简介
- 02 CHIP-seq简介
- 03 RNAseq结果标准化之RPKM、FPKM 和 TPM
- 04 DESeq2 - 文库标准化
- 05 edgeR-文库标准化
- 06 edgeR与DESeq2:过滤低reads计数基因控制假阴性数量
- 07 FDR - 控制假阳性事件
- 08 Fisher’精确检验与富集分析
- 09 RNA测序的技术重复与生物重复
- 10 热图的绘制和解读
6. 展望
最近更新:StatQuest视频从开始推出以来,至今一直也在陆陆续续更新中,想要学习的伙伴可以关注StatQuest with Josh Starmer,不方便的伙伴也可以通过关键词在B站搜索自己想看的章节,从中轻松愉快的学到更多的知识。
最后,感谢statquest团队陪伴我们学习,祝大家学习愉快、工作顺利,多发papers!
编辑:吕琼
校审:罗鹏