最新 最热

大数据ETL说明(外)

原文地址:https://pusdn-dev.feishu.cn/docx/G4VddZVtSoJTcvxOHAccxk8Hnph

2023-10-11
1

如何实现画像标签的数据质量监控

保证标签数据质量是画像平台建设不可或缺的一个重要环节,只有保证产出高质量的标签,画像平台上的功能才有价值,这也是人群圈选准确性和画像分析结论有效性的前提和基础。如何通过工程化的方式评估一个标签的质量?表3-13展...

2023-10-10
1

ClickHouse(03)ClickHouse怎么安装和部署

本文会介绍如何安装和部署ClickHouse,官方推荐的几种安装模式,以及安装之后如何启动,ClickHouse集群如何配置等。

2023-10-10
1

Blood新成果阐明“亚洲型”DEL血型患者安全输注RhD阳性血液机制

2023年1月,国家基因库生命大数据平台支撑科研成果在《Blood》发表。该研究题为“Patients with Asian-type DEL can safely be transfused with RhD-positive blood”,研究结果表明亚洲型DEL患者可以安全地使用RhD阳性...

2023-10-08
0

大数据架构设计(四十五)

Lambda架构设计目的在于提供一个满足大数据系统关键特性的架构。整合离线计算和实时计算,融合不可变性、读写分离和复杂性隔离等原则。

2023-10-08
1

【scikit-learn 估计器】 距离方法

对新个体分类时,需要查找训练集,找到与该新个体最相似的个体,然后根据该个体所属类别将新个体归类到该类别下。

2023-10-07
0

中心能源管控平台架构与功能

数据中心能源站、冬奥村能源站、光伏系统等子系统交互,实现能源的综合调度与运行管理;参考文献研究智慧能源管控平台的架构和主要功能,主要功能包括多能实时监测、多能优化调度、能源销售一体化管理、智能运维、智慧能源...

2023-10-07
1

大数据圈还能混吗?

工作这么多年,浪尖一直从事大数据相关的架构设计,计算框架的二次开发,尤其是实时计算框架,最近两年在搞实时数仓和数据分析,浪尖算是跟着大数据生态成长起来的老人了。...

2023-10-07
0

大数据服务上k8s主要是为了什么?

今天我要和大家探讨一个备受关注的话题:为什么在大数据服务上使用 Kubernetes(简称 K8s)?Kubernetes 是一个用于自动化容器化应用程序部署、扩展和管理的开源平台,而大数据服务通常包括庞大的数据集和复杂的计算工作负载,这...

2023-10-04
0

Python大数据之Python进阶(三)多进程的使用

获取进程编号的目的是验证主进程和子进程的关系,可以得知子进程是由那个主进程创建出来的。

2023-09-29
1