最新 最热

基于Pytorch的多任务推荐系统工具包发布

MTReclib是基于PyTorch开发的用于多任务推荐系统的开源框架。在MTReclib中,我们实现了诸多经典的多任务推荐模型,并且提供了4个多任务数据集以及相应结果。该框架易于扩展,基于该框架设计新的多任务模型或者尝试新的数据...

2022-04-08
1

10种聚类算法的完整python操作实例

聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好探索一系列聚类算法以及每种算法...

2022-04-08
1

数仓建设 | ODS、DWD、DWM等理论实战(强烈建议收藏~)

数仓在建设过程中,对数据的组织管理上,不仅要根据业务进行纵向的主题域划分,还需要横向的数仓分层规范。本文作者围绕企业数仓分层展开分析,希望对你有帮助。...

2022-04-07
0

万字详解数据仓库、数据湖、数据中台和湖仓一体

数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据中台已成气候”……...

2022-04-07
1

数据量大了跑不动?PySpark特征工程总结

我们定义了一些测试数据,方便验证函数的有效性;同时对于大多数初学者来说,明白函数的输入是什么,输出是什么,才能更好的理解特征函数和使用特征:...

2022-04-06
0

TASKCTL应用工程和作业类型的定义

应用工程简称工程,从业务系统角度去划分调度系统。每个应用工程管理所属的流程、定时器、变量等调度元信息。还可分配平台节点权限用于限定平台网络架构的系统范围。...

2022-04-06
0

知乎:做数据分析有前(钱)景吗?

接触到的大厂朋友他们说,单纯的数据分析岗在国内互联网企业多是数据支持型,为产品、市场、供应链等部门服务,不直接产生价值(money)。

2022-04-03
0

如何使用sklearn优雅地进行数据挖掘?

显然,这不是巧合,这正是sklearn的设计风格。我们能够更加优雅地使用sklearn进行特征工程和模型训练工作。此时,不妨从一个基本的数据挖掘场景入手:...

2022-04-03
1

商业数据分析比赛实战,内附项目代码

数据竞赛平台和鲸社区最近正在举办一场数据分析大赛,不仅带来了22w奖金和30w创业基金支持,更是提供了统一的在线比赛环境,引入投中网的独家创业投资类数据,囊括了江苏地区科技金融,生物医药、芯片半导体制造行业,吸引了不少...

2022-04-03
0

TASKCTL调度平台服务节点管理

TASKCTL调度管理平台系统Admin给具有管理员权限的用户,提供了平台级的调度节点管理,系统工程管理,作业类型管理,用户(组)权限管理,常量管理等功能;另外还提供了短信、邮件等平台消息接口配置维护,强制签入(流程)维护,以及平台调度...

2022-04-01
1