最新 最热

利用标签与样本之间的统计信息改善文本分类中的embedding表示

基于文本Embedding表示的文本分类已经非常常见了,基本是文本分类的基本选择之一。然而,传统的embedding方式,都是直接使用预训练好的embedding,比如Word2Vec、Glove等。...

2021-07-23
0

其它GIS相关数据下载网站整理

继续我们的GIS数据获取网站整理。和前期的文章不一样,本文对目前主要的、GIS行业可能会用到的相关数据获取网站加以整理与介绍——之所以将这些数据网站放在这一类别中,是因为其可能在GIS中应用较少,例如影片评分数据、...

2021-07-22
0

如何通过数据挖掘的方法做出准确的用户画像?

上期我们分享了jupyter notebook几个好用的插件 超好用的jupyter notebook5个常用插件,最近很多朋友问到关于用户画像的问题,似乎大家对此都很感兴趣,今天我们就来聊一聊到底什么是用户画像,它的作用是什么以及如何通过数...

2021-07-22
1

Pandas高级教程之:自定义选项

pandas有一个option系统可以控制pandas的展示情况,一般来说我们不需要进行修改,但是不排除特殊情况下的修改需求。本文将会详细讲解pandas中的option设置。...

2021-07-22
1

理论结合实践,一文搞定异常检测技术

数据集汇总的异常数据通常被认为是异常点、离群点或孤立点,特点是这些数据的特征与大多数数据不一致,呈现出"异常"的特点,检测这些数据的方法称为异常检测。...

2021-07-21
0

现代企业架构师的5大特征及六种方法

企业架构在过去十年中取得了长足的进步。随着越来越多新技术出现,充分利用这些因素来将企业架构创建得更好十分重要。通过将新技术集成到企业架构中,即使在困难时期,也能取得丰硕的成果。...

2021-07-21
1

Python 的 TIOBE 编程语言7月排名逼近榜首!未来可期,大有可为!

最近,编程语言流行程度指数——TIOBE 发布了 2021年7月的编程语言流行指数榜单。

2021-07-20
0

高考志愿填报指南——统计学专业介绍

本文将系统的介绍统计学专业的专业概况、就业前(钱)景、就业方向、以及企业对招聘时对学历的要求、最后将谈一些自己的择校建议。

2021-07-20
0

Pandas高级教程之:稀疏数据结构

如果数据中有很多NaN的值,存储起来就会浪费空间。为了解决这个问题,Pandas引入了一种叫做Sparse data的结构,来有效的存储这些NaN的值。

2021-07-20
1

有哪些关于人工智能的书籍可供推荐?

包括机器学习、计算机视觉、计算机图形学、自然语言处理、语音、数据挖掘、智能问答、机器翻译、软件开发、AI 伦理、商业创新……这些书单里既有最经典的专业书籍,也有一些适合轻快阅读的大众读物。...

2021-07-19
0