最新 最热

【收藏】AI高频词汇 TOP15 -入门版

▼人工智能就是人脸识别?▼深度学习和机器学习有什么区别?▼大家都在谈的迁移学习到底讲了些啥?▼看个新闻都要查字典怎!么!破!AI高频词汇TOP15(入门版) 特!别!放!送!啦!---- 01计算机视觉 Computer Vision计算机视觉(Computer Vis...

2019-03-06
1

数据工程师进阶计划,这有一份2019开年自学清单

优质大型的公司对于数据分析以及机器学习类岗位的需求高居前列。本文给出了针对小白和有简单数据科学基础的同学的学习计划,可以让你在浩如烟海的数据科学学习资料中找到自己的兴趣。...

2019-03-04
0

数据对业务价值帮助的一些思考

关于数据的价值,居士认为可以参考BI(商业智能)的定义。这里不简单地指做几张报表的工作,而是数据辅助决策。下面引用一下百度百科关于商业智能的定义。...

2019-02-28
0

数据仓库的一些建议

大数据时代,作为数据的掌握者,我们不仅要更好地使用数据,也要更好地管理数据。而数据仓库正是这样一套管理和组织数据的解决方案。

2019-02-28
0

Apache Hadoop大数据平台,金融行业搭建大数据平台,数据采集、分析、处理如何实现?

Apache Hadoop目前市场上主流的大数据研发技术之一,基于 Hadoop 开源框架开发的一个开源的分布式存储、分布式计算平台。

2019-02-27
1

开源的数据挖掘工具

本文的主要内容编译自Blaz Zupan和Janez Demsar的一篇论文(Open-Source Tools for Data Mining)。我仅仅选择其中的要点和大家共享,同时加入一些个人的点评意见。...

2019-02-18
0

【转载】使用sklearn优雅地进行数据挖掘

数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、tra...

2019-02-14
1

使用 IBM SPSS Modeler 进行社交网络分析,用15哦

社交网络分析是人、组织、计算机或者其他信息或知识处理实体之间的关系和流动信息的映射和测量。图 1 是社交网络的一个示意图,其中的节点表示人、组织、计算机或者其他信息或知识处理实体;连线表示节点之间的关系或信...

2019-02-14
0

错误使用tf-idf的实例分享

项目中需要计算两个电视节目的相似程度,有人提出将自然语言处理当中的经典TF-IDF(Item frequency-inverse document frequency)引入作为节目的特征,然后使用余弦距离进行相似度计算。由于TF-IDF的应用领域与电视节目的信...

2019-01-18
0

使用ElasticSearch完成百万级数据查询附近的人功能

上一篇文章介绍了ElasticSearch使用Repository和ElasticSearchTemplate完成构建复杂查询条件,简单介绍了ElasticSearch使用地理位置的功能。

2019-01-17
0