最新 最热

『 论文阅读』10 CHALLENGING PROBLEMS IN DATA MINING RESEARCH

数据挖掘研究的当前状态太“特别”。许多技术都是针对个体问题设计的,如分类或聚类,但没有统一的理论。然而,统一不同数据挖掘任务(包括聚类,分类,关联规则等)以及不同数据挖掘方法(如统计,机器学习,数据库系统等)的理论框架将有...

2021-10-19
0

如何突破个人价值,避免落入能力陷阱?

各位好,我是一名从事产品,转了数据分析师,又转数据产品的产品策划。在过去的4年多时间里,也经历过了美妆电商,哔哩哔哩漫画,还有六脉创造营的各创新业务(水印相机,QQ扩列,QQ自习室,手机QQ相机等)。在这些宝贵的过程中,我不断的进...

2021-10-19
0

Python 遇见茶文化,鉴茶指南

阅读本文及源码,可以和小编一起学到 xpath 表达式爬取数据,多进程爬取,pandas 基本操作,pyecharts 可视化,stylecloud 词云,文本余弦相似度相似度,KMeans,关键词提取算法:TextRank,TF-IDF,LDA 主题模型。...

2021-10-18
1

搜索引擎背后的经典数据结构和算法

我们每天都在用 Google, 百度这些搜索引擎,那大家有没想过搜索引擎是如何实现的呢,看似简单的搜索其实技术细节非常复杂,说搜索引擎是 IT 皇冠上的明珠也不为过,今天我们来就来简单过一下搜索引擎的原理,看看它是如何工作...

2021-10-15
0

看动画学算法之:平衡二叉搜索树AVL Tree

考虑一下二叉搜索树的特殊情况,如果一个二叉搜索树所有的节点都是右节点,那么这个二叉搜索树将会退化成为链表。从而导致搜索的时间复杂度变为O(n),其中n是二叉搜索树的节点个数。...

2021-10-15
1

【生信文献200篇】67 CHIP-Atlas数据库

英文标题: ChIP-Atlas: a data-mining suite powered by full integration of public ChIP-seq data

2021-10-12
0

再次强调表达量矩阵分析一定要三张图

如果分组在3张图里面体现不出来,实际上后续差异分析是有风险的。这个时候需要根据你自己不合格的3张图,仔细探索哪些样本是离群点,自行查询中间过程可能的问题所在,或者检查是否有其它混杂因素,都是会影响我们的差异分析结...

2021-10-12
0

肿瘤微环境看基质和免疫细胞就太泛了

实际上, 这个方法还是过于粗糙了,肿瘤微环境的复杂程度,远不止基质和免疫细胞简单的归类。我随手查了一个比较新的综述文章:《Tumor microenvironment complexity and therapeutic implications at a glance》,链接是https...

2021-10-12
0

你不会以为它们的免疫评分都是自己算的吧

但是接下来大家又想问,同样的想比较两个分组的免疫评分的差异,但是免疫评分的工具太多了,比如有一个2019的综述文章:《Comprehensive evaluation of transcriptome-based cell-type quantification methods for immuno-on...

2021-10-12
0