最新 最热

字节跳动安全Ai挑战赛-小样本赛道方案总结字节跳动安全Ai挑战赛-小样本赛道方案总结

在真实的社交网络中,存在的作弊用户会影响社交网络平台。在真实场景中,会受到多方面的约束,我们仅能获取到少部分的作弊样本和一部分正常用户样本,现需利用已有的少量带标签的样本,去挖掘大量未知样本中的剩余作弊样本。 ...

2021-12-09
0

智能营销增益(Uplift Modeling)模型——模型介绍(一)

Uplift Modeling在智能营销中非常重要,一般来说个性化营销人群中存在四类:

2021-12-07
0

sklearn中多种编码方式——category_encoders(one-hot多种用法)

离散型编码的Python库,里面封装了十几种(包括文中的所有方法)对于离散型特征的编码方法,接口接近于Sklearn通用接口,非常实用 可以使用多种不同的编码技术把类别变量转换为数值型变量,并且符合sklearn模式的转换。...

2021-12-07
0

Patterns|诺华举办内部挑战赛,用AI预测候选药物的临床试验成功率

鉴于药物研发的高昂费用,制药公司只能承担数量有限的药物管线。那么更准确地预测药物开发项目的风险,意味着可以更有效地分配资金。

2021-12-06
1

[当人工智能遇上安全] 4.基于机器学习的恶意代码检测技术详解

《当人工智能遇上安全》系列博客将详细介绍人工智能与安全相关的论文、实践,并分享各种案例,涉及恶意代码检测、恶意请求识别、入侵检测、对抗样本等等。只想更好地帮助初学者,更加成体系的分享新知识。该系列文章会更加...

2021-12-03
0

机器学习起步-数据收集及预处理常见的流程

数据是机器学习的燃料,数据预处理就是为机器学习模型提供好燃料,数据好,模型才能跑得更带劲。。

2021-12-02
1

推荐系统炼丹笔记3:排序篇,一本家谱

第3期,排序篇 本文介绍在排序阶段交叉模块的思考和基于LR+GBDT、FM等开始的排序模型的演变,后续将继续梳理成相关系列。本文小编大部分内容摘自炼丹笔记之前的汇总.....实在是太懒了。...

2021-12-02
0

[系统安全] 三十三.恶意代码检测(3)基于机器学习的恶意代码检测技术

该系列文章将系统整理和深入学习系统安全、逆向分析和恶意代码检测,文章会更加聚焦,更加系统,更加深入,也是作者的慢慢成长史。漫漫长征路,偏向虎山行。享受过程,一起加油~...

2021-12-01
0

机器学习 | 特征工程(数据预处理、特征抽取)

所谓特征工程即模型搭建之前进行的数据预处理和特征提取。有时人们常常好高骛远,数据都没处理好就开始折腾各种算法,从第一开始就有问题,那岂不是还没开始就已经结束了。所以说啊,不积跬步无以至千里,生活中的每个细节,都可...

2021-11-29
0

机器学习 | 特征工程综述

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。...

2021-11-29
0