最新 最热

爬虫架构|利用Kafka处理数据推送问题(2)

在前一篇文章爬虫架构|利用Kafka处理数据推送问题(1)中对Kafka做了一个介绍,以及环境搭建,最后是选择使用阿里云的Kafka,这一篇文章继续说使用阿里云的Kafka的一些知识。一、发布者最佳实践发布的完整代码(根据自己的业务做...

2018-05-21
1

[日本]智能电表的引入,使电力行业数据量增至3000倍

从事企业数据分析及未来预测业务的美国SAS Institute公司近年开始涉足基于大数据分析的预测及规划业务。该公司电力业务部门主管Tim Fairchild日前接受了本站记者采访,介绍了大数据分析在电力业务中的效果以及对日本市...

2018-05-21
1

Windows平台使用Python切换用户运行程序

在Windows平台,如果需要以某个指定用户来运行程序,此时可以通过使用 Windows CreateProcessAsUser API来实现。但是要实现这个功能首先需要有要切换用户的用户名和密码。import psutilimport win32processimport win32s...

2018-05-14
1

Linux 下的两种分层存储方案

在存储设备中,使用分层技术,将冷热数据自动分层存放在具有不用读写性能的存储介质上,已经是很普遍的做法,比如 IBM 的 DS8K 中使用的 Easy Tier。这些功能都需要存储设备固件的支持,如何在 Linux 主机上,使用 Linux 现有的...

2018-05-03
1

20 个强大的 Sublime Text 插件

作 为一个开发者你不可能没听说过SublimeText。不过你没听说过也没关系,下面让你明白。 SublimeText是一款非常精巧的文本编辑器,适合编写代码、做笔记、写文章。它用户界面十分整洁,功能非同凡响,性能快得出奇。这些非常...

2018-05-03
1

使用compass自动拼css sprite

css sprite (css 雪碧)又叫css精灵,是一种图片拼合技术。多用在图标上,把几个图标拼成一个图片,页面加载的时候只需要load拼好的图片,然后使用background-position配合width、height来显示不同的图标。这样做可以减少页面请...

2018-05-02
1

一个资深数据人对数据挖掘解读

在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过程中,发现数据挖掘本身包含很多...

2018-04-25
1

图解机器学习(清晰的路线图)

每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客...

2018-04-25
1

[职业]数据科学领域的职位划分以及职责技能

随着数据科学领域的招聘信息越来越多,范围也越来越广.Datacamp根据最新的数据科学相关招聘信息,全面的了解各个行业之间数据科学领域每个职位角色之间的差异,以及所赋予的工作职责。最主要分为以下几...

2018-04-25
1

【探讨】你仅仅是个数据工具使用者吗?

有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」......高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工具,使用工具是为了解决某种问题,而问题本身有往往有不同的场景(不可穷举),有可...

2018-04-24
1