最新 最热

CIKM 2019 挑战杯「用户兴趣高效检索」冠军方案:两段式高效推荐中关键技术解析

近日,由阿里巴巴承办的 CIKM 2019 AnalytiCup 在北京圆满落幕,来自青岛大学和春秋航空的成员组成的团队 QDU 摘得了“用户兴趣高效检索”赛道的桂冠。

2019-11-14
1

TCGA数据库挖掘肿瘤相关基因突变(2)cBioPortal

TCGA是一个综合性的多组学肿瘤基因组数据库,除包含DNA测序之外,还包含了RNA测序、拷贝数、蛋白谱、甲基化等多个组学的数据,但是在TCGA的官方网站GDC Data Portal (https://portal.gdc.cancer.gov/)...

2019-11-14
0

如何成为数据科学家?这有一条完整的学习路线和方法!

从事数据科学家的工作,不仅意味着你将能够在工作中实践前沿的技术去解决业务问题,同时意味着丰厚的薪水。这两者都能给你带来巨大的成就感。

2019-11-13
0

【干货】22道机器学习常见面试题目

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。...

2019-11-12
1

【干货】22道机器学习常见面试题目

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。...

2019-11-12
1

干货 | 整理一份详细的数据预处理方法

作者:lswbjtu https://zhuanlan.zhihu.com/p/51131210

2019-11-12
0

你会用Python做数据预处理吗?

在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析(你愿意花十分钟系统了解数据分析方法吗?),对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数...

2019-11-12
0

一名合格的数据分析师,需要具备哪些能力?

基础知识包含数学、线性代数、统计学等,这些也是决定数据分析职业发展高度的基石。对于初学者,学习描述统计相关的内容和公式即可,再进一步就需要掌握统计算法,甚至是机器学习算法。对于算法相关的工作,则要对高数进行深入...

2019-11-12
0

一览群智胡健:在中国完全照搬Palantir模式,这不现实

神秘的硅谷大数据挖掘公司 Palantir 是国内众多创业公司看齐的标杆,其业务是为政府和金融领域的大客户提供数据分析服务,帮助客户作出判断,甚至“预知未来”,它已于近期寻求 IPO,估值在 360 亿美元到 410 亿美元之间。...

2019-11-12
1

数据团队思考:小型数据团队发展的6大建议

总之,这个吐槽内容是挺多的,就不多写了,有过类似工作经历的朋友应该会有很多共鸣。鉴于这些吐槽的内容,居士将从如下几个方面来分享本篇的主题:小型数据团队发展的6大建议...

2019-11-12
0