最新 最热

美团外卖特征平台的建设与实践

随着美团外卖业务的发展,算法模型也在不断演进迭代中。本文从特征框架演进、特征生产、特征获取计算以及训练样本生成四个方面介绍了美团外卖特征平台在建设与实践中的思考和优化思路。...

2021-03-09
0

图算法在网络黑产挖掘中的思考

导读:虚拟网络中存在部分黑产用户,这部分用户通过违法犯罪等不正当的方式去谋取利益。作为恶意内容生产的源头,管控相关黑产用户可以保障各业务健康平稳运行。当前工业界与学术界的许多组织通常采用树形模型、社区划分等...

2021-03-03
0

kaggle-1-Titanic

kaggle上的Titanic数据处理、特征工程,建模等 中位数填充缺失值特征工程处理建模过程导入相关库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport seabo......

2021-03-02
0

《风控要略:互联网业务反欺诈之路》一万字读后详细总结

本书的内容正如书名所述,是为要略而非攻略,即作者站在一个更为宏观的角度,以自身的从业经验对当今风控领域做了一番较为全貌的总结概述。书中的章节内容有精有简,既为要略,那么就无法苛求其内容都足够全面与详细。它更像是...

2021-03-02
1

[Kaggle] Housing Prices 房价预测

最相关的特征 ['OverallQual', 'GrLivArea', 'GarageCars', 'GarageArea', otalBsmtSF', '1stFlrSF', 'FullBath', 'TotRmsAbvGrd', &#...

2021-02-19
0

从0梳理1场数据挖掘赛事!

摘要:数据竞赛对于大家理论实践和增加履历帮助比较大,但许多读者反馈不知道如何入门,本文以河北高校数据挖掘邀请赛为背景,完整梳理了从环境准备、数据读取、数据分析、特征工程和数据建模的整个过程。...

2021-02-05
0

机器学习的跨学科应用——模型篇

数据集的大小基本上可以确定您选择的机器学习模型。对于较小的数据集,经典的统计机器学习模型(例如回归,支持向量机,K近邻和决策树)更加合适。相比之下,神经网络需要大量数据,并且只有当您拥有成千上万个或者更多的训练数据...

2021-02-04
0

CellPress | 医学上人工智能的缺失

整个医疗保健链中的利益相关者正在寻求将人工智能(AI)纳入其决策过程。从早期药物开发到临床决策支持系统,已经看到了AI如何提高效率和降低成本的示例。本文讨论了应优先考虑的一些关键因素,以使AI在整个医疗保健价值链...

2021-02-01
0

关于恶意软件加密流量检测的思考

近年来,随着人们网络安全意识的提升,对于数据保护的意识也越来越强,加密技术在互联网上迅速普及。TLS作为数据包加密的标准协议,现在被各个主要的网站用来保护用户的消息、交易和凭证,但是越来越多的恶意软件也利用TLS加密...

2021-01-27
0

Kaggle系列- Russia房产价格预测top1%(22/3270)方案总结

比赛名称:Sberbank Russian Housing Market 比赛链接:https://www.kaggle.com/c/sberbank-russian-housing-market

2021-01-18
0