最新 最热

5分钟 NLP系列—— 11 个词嵌入模型总结

TF-IDF, Word2Vec, GloVe, FastText, ELMO, CoVe, BERT, RoBERTa

2022-03-12
0

baseline来啦!第三届厦门国际银行数创金融杯金融营销建模大赛

厦门国际银行数创金融杯已经举办第三届了,是专门针对金融机构痛点专门设立的金融风控竞赛。很多初学者不知道如何快速入门数据挖掘,其实最好的方式就是自己动手做一遍竞赛,这其中有业务理解,也有技术技巧上的提升,对于个人...

2022-03-11
1

详解数据科学与数理统计的基本概念

随着计算机技术的发展和有用数据的快速增多,数据科学应运而生。数据科学的总体目标是在已有数据集的基础上,通过特定的算法提取信息,并将其转化为可理解的知识以辅助做决策。...

2022-03-11
0

关于自然语言处理之one hot模型

最近工作实在有点忙,前阵子关于梯度和导数的事情把人折腾的够呛,数学学不好,搞机器学习和神经网络真是头疼;想转到应用层面轻松一下,想到了自然语言处理,one hot模型是基础也是入门,看起来很简单的一个列表转矩阵、词典的功...

2022-03-11
0

Excel图表和数据分析

从理论指导角度,数据分析可以划分为基于统计学的和基于数据挖掘的数据分析方法,很显然基于统计学的相对容易理解一些,而数据挖掘对高等数学要求会高一些,相信毕业十几年的同学很可能连A*X**2+B*X+C=0都快忘记了,甚至我不确...

2022-03-11
0

一次大数据分析模型实践分享

关于数据挖掘,我给大家分享的案例是猫池终端识别模型和日间隔预警模型。当然作为运营商一般是自己很少全程参与的,但这两个模型基本上从需求定义、指标选取、指标确认、挖掘算法、模型结果确认和优化是我参与和把控的。...

2022-03-11
1

关于数据挖掘关联规则的Oracle实现

呵呵,前几天拿到了数据挖掘基础教程一书,感觉部分算法是基于统计学的原理的,而统计学是可以通过Oracle来实现。

2022-03-11
0

ETL批量调度工具TASKCTL核心调度节点安装

TASKCTL 自动化技术标准产品采用典型的B/S模式,应用层为客户端,控制层为服务端。同时,服务端完成对目标层的调度控制。整个平台采用无数据库设计,每层之间以TCP作为通信协议。...

2022-03-11
0

关于自然语言处理系列-聊天机器人之gensim

技术点:ctr预估,learning to rank,排序模型指标评测,逻辑回归,gbdt

2022-03-11
0

关于自然语言处理系列-关键词提取

自然语言处理包括中文分词、词性标注、关键词抽取、依存句法分析、文本分类接口情感分析、词义相似度计算、实体标识、文本摘要等等,慢慢来吧,看看一步步能到什么程度。本文实现的是关键词提取。...

2022-03-11
0