最新 最热

Linux环境下批量执行队列任务的优雅方案

例如需要批量提交spark任务来对不同城市的业务数据进行挖掘,但由于计算资源有限,最好控制每次只执行几个任务。

2020-12-02
0

大数据科普文一篇

大数据是指其大小和复杂性无法通过现有常用的工具软件,以合理的成本,在可接受的时限内对其进行捕获、管理和处理的数据集。这些困难包括数据的收入、存储、搜索、共享、分析和可视化。大数据要满足三个基本特征(3V),数据量...

2020-12-02
0

10万级etl作业批量调度工具Taskctl之轻量级Web应用版

批量处理是银行业整个信息后台最为重要的技术形态,也是银行核心信息资产数据的分享、传输、演化的重要技术手段。有调查指出,全球70%的数据是经过批量处理得以再次使用,可见批量处理在整个信息生态中的技术占比与重要性...

2020-11-30
1

一位SAP培训顾问的建议:SAP HANA应该如何学习?

SAP HANA应该如何学习? 从HANA本质来讲大家都知道,就是一个数据库,和Oracle,SQL Server 没啥本质的区别,内存计算、列式存储也不是啥新玩意,所以学习HANA和学习一个新的数据库从这个角度看也非常类似,当然HANA有其非常独特的...

2020-11-27
1

免费开源ETL工具Taskctl永久授权使用

TASKCTL 遵循软件产品标准化的原则,以“专业、专注”为设计理念,结合ETL 调度领域自身的特点,构建了一套直观易 用的 ETL 控制容器调度设计、监控 维护、管理平台 taskctl-web-application。...

2020-11-25
0

《基因大数据智能生产及分析》笔记

基因慧的行业报告整体上不错,这次《基因大数据智能生产及分析》也不例外,一口气读完,感受是智能化是行业趋势,打工人的日子更难了。文章有点长,没时间看的话你可以拉到文后看我的一点感想。...

2020-11-19
0

Hive函数-1-时间日期相关

hive中内置了很多日期、数值、集合、聚合等内置函数,本文中主要介绍的常见的日期和时间相关的函数。

2020-11-19
1

【SFFAI分享】晋嘉睿:一种高效的基于邻居的异构图交互模型【附PPT与视频资料】

本次分享主要关注异构图(或者叫异构网络)在数据挖掘中的应用,特别是异构图交互模型在推荐系统中的应用。通过分析前期工作的两类思路,一是基于基于图中邻居的信息,另一个是基于元路径的信息;重点探讨了交互信息在两种思路中...

2020-11-19
1

手把手教你用Python进行帕累托分析(二八定律)

导读:本文带你用Python进行贡献度分析。贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。

2020-11-16
0

etl调度工具Taskctl——稳定强大web版“0元授权”

2020年疫情席卷全球,更是对整个市场经济造成了严重影响,年初疫情肆虐,西方世界单方面的科技、经济封锁,国际关系吃紧.....导致很多中小型企业业务链受阻,大型企业经费资金吃紧,轮班制导致公司运维人员工作量大幅增加;塔斯克...

2020-11-13
0