最新 最热

数据科学系列:sklearn库主要模块功能简介

作为一名数据分析师,当我初次接触数据分析三剑客(numpy、pandas、matplotlib)时,感觉每个库的功能都很多很杂,所以在差不多理清了各模块功能后便相继推出了各自教程(文末附链接);后来,当接触了机器学习库sklearn之后,才发现三剑...

2020-09-08
1

相似问答检索——汽车之家的 Milvus 实践

汽车之家作为中国汽车互联网平台,拥有全球最大的汽车社区论坛。多年来积累了丰富的用户问答数据,能够解决用户在看车、买车、用车等方面遇到的各种问题。针对用户在平台上提出的各种问题,从海量的高质量问答库中匹配语义...

2020-09-08
0

风控建模整体流程

在信贷领域中建立风控模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。

2020-09-08
0

KDD 2020 | 详解语义Embedding检索技术在Facebook搜索中的应用实战

导读:今天分享一下Facebook发表在KDD 2020的一篇关于社交网络搜索中的embedding检索问题的工作,干货很多,推荐一读。

2020-09-07
0

特征工程入门:应该保留和去掉那些特征

在特征/列上执行的任何能够帮助我们根据数据进行预测的操作都可以称为特征工程。这将包括以下内容:

2020-08-31
0

KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践

ACM SIGKDD (国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域的国际顶级会议。

2020-08-28
0

基于PySpark的流媒体用户流失预测

对于音乐流媒体业务来说,确定可能流失的用户(即有可能从付费降级到取消服务的用户)是关键。

2020-08-28
0

关于逻辑回归,面试官们都怎么问

「面试官们都怎么问」系列文章主旨是尽可能完整全面地整理ML/DL/NLP相关知识点,不管是刚入门的新手、准备面试的同学或是温故知新的前辈,我们希望都能通过这一系列的文章收获到或多或少的帮助...

2020-08-26
0

A Survey on Text Classification: From Shallow to Deep Learning-文本分类大综述

摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类...

2020-08-24
0

算法工程师当前选哪个方向好?

看了很多回答,模棱两可、模糊不清,给岀一番没有意乂的解释,最终也没有给岀自己的意见。

2020-08-21
0