最新 最热

BI、数据仓库、ETL和数据开发(大数据开发)会有区别吗?

基本上1,3 ,4 ,6,7项工作是属于工程属性比较强的工作,2,5项属于工程和领域知识有交叉的工作。

2019-12-23
0

RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析

我们有很多学徒数据挖掘任务,已经完成的目录见:学徒数据挖掘专题半年目录汇总(生信菜鸟团周一见) 欢迎大家加入我们的学习团队,下面看FPKM文件后该怎么下游分析...

2019-12-23
0

2020 AAAI Fellow 出炉,Yann Lecun、Yoshua Bengio 入选

AI 科技评论消息,日前 2020 AAAI Fellow 入选结果已经出炉。据了解,全球范围内共有 10 位学者当选。其中就有 2018 年刚获得图灵奖的深度学习先驱 Yoshua Bengio 和 Yann LeCun,这也是继ACM颁发图灵奖之后,这“深度学习三...

2019-12-23
0

BDK | 一起来修炼大数据/数据仓库的内功吧

先前有在公众号里说到了接下来自己的学习重点会放在数据仓库的设计与建设、ETL、大数据架构相关的内容了,所以今天就先开一个专栏来专门存放这类的知识,叫 BDK!聪明的你应该也猜到就是BigData Knowledge的简称了。虽然说...

2019-12-19
0

TF-IDF

简单来说,向量空间模型就是希望把查询关键字和文档都表达成向量,然后利用向量之间的运算来进一步表达向量间的关系。比如,一个比较常用的运算就是计算查询关键字所对应的向量和文档所对应的向量之间的 “相关度”...

2019-12-18
0

文本挖掘 – Text mining

文本摘要:许多文本挖掘应用程序需要总结文本文档,以便对大型文档或某一主题的文档集合做出简要概述。

2019-12-18
0

《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第13章 使用TensorFlow加载和预处理数据

Data API还可以从现成的文件(比如CSV文件)、固定大小的二进制文件、使用TensorFlow的TFRecord格式的文件(支持大小可变的记录)读取数据。TFRecord是一个灵活高效的二进制格式,基于Protocol Buffers(一个开源二进制格式)。Dat...

2019-12-16
0

AB实验的高端玩法系列2 - 更敏感的AB实验, CUPED!

AB实验可谓是互联网公司进行产品迭代增加用户粘性的大杀器。但人们对AB实验的应用往往只停留在开实验算P值,然后let it go。。。let it go 。。。

2019-12-16
0

AB实验的高端玩法系列3 - AB组不随机?观测试验?Propensity Score

都说随机是AB实验的核心,为什么随机这么重要呢?有人说因为随机所以AB组整体不存在差异,这样才能准确估计实验效果(ATE)

2019-12-16
0

特征工程|空间特征构造以及文本特征构造

关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~

2019-12-11
1