在R for data science这本书中,作者提出数据分析的一个流程,在数据转换、可视化以及建模之后,来到数据分析的新阶段:与别人分享我们的数据。之前我们分享了许多单细胞数据分析的教程cellranger拆库定量、seurat质控分析,mo...
曾几何时,我在一次面试中,面试官问,“数据挖掘和机器学习有什么区别?”,朋友们也可以思考下这个问题。
我们知道,做好数据工作,需要统计学的知识和方法以及应用统计学解决问题的思维和能力。R语言最初是由两位统计学教授以S语言为原型实现的开源语言,后来得到很多人参与,贡献和关注,已经有一个活跃的生态圈,并且是一种积极向上...
对于机器学习/数据科学的研究者而言,回归分析是最基础的功课之一,可以称得上是大多数机器学习/数据科学研究的起点。
“PDFMV框架是问题-数据-特征-模型-价值五个英文字母的首字母组合而成,它是以问题为导向,数据为驱动,利用特征和模型从数据中学习到知识,以创造价值的系统化过程。”...
Julia 是一种多范式的函数式编程语言,用于机器学习和统计编程。尽管 Python 通常被认为是一种面向对象的编程语言,其实它也是用于机器学习的多范式编程语言。需要注意的是,Julia 语言更多地基于函数范式。此外,Julia 语言...
这里运行R语言包GDCRNATools的帮助文档中的例子获得胆管癌的rna表达矩阵
博客地址:https://www.jianshu.com/u/619b87e54936
你想成为一名数据科学家吗?你对数据科学了解很多,想知道关于数据科学天花乱坠的宣传都在讲什么吗?
STRING 链接 https://string-db.org/数据集我使用R语言包clusterProfiler中经常用作示例的基因列表获取gene symbol的代码