最新 最热

MNode大揭秘!腾讯云EMR如何实现免运维与计算成本降本超30%

当前腾讯云 EMR 集群主要采用 HOST 资源部署, HOST 具备按需使用、易于部署与维护、高度灵活性以及企业自主性强等优势。然而,这要求企业运维人员具备熟练的运维能力。随着企业数据规模的增长和处理计算任务的增多,企业...

2024-09-11
1

腾讯云EMR智能洞察:让大数据应用分析更“Easy”

随着企业数据规模的不断增长,人工方式分析大数据平台的计算任务、存储和调度性能已经无法满足业务要求。面对每天数以万计的计算任务和海量的存储数据,传统人工分析不仅会浪费大量时间,同时也需要分析人员具备较高的专业...

2024-08-11
1

自建迁移EMR实践案例

自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这...

2024-06-13
1

「EMR 开发指南」之 Oozie 作业调度

本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。

2023-11-30
1

「EMR 开发指南」之 Kylin 存算分离方案

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。...

2023-11-29
1

「EMR 运维指南」之 Kylin 迁移方案

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。...

2023-11-28
1

「EMR 开发指南」之 Kylin 快速构建 Cube

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。...

2023-11-28
1

「EMR 运维指南」之 Kerberos 跨域认证方案

多个开启 kerberos 的 hadoop 集群之间要做通信(跨集群的数据迁移等),因为 Kerberos 原因无法正常进行,本文档说明了多 kerberos 集群下做跨域认证的方法。...

2023-11-24
1

「EMR 运维指南」之 Kerberos 跨域互信配置

本文以Cluster-A跨域去访问Cluster-B中的服务为例。配置完成后,Cluster-A在获取到本集群KDC授予的TGT(Ticket Granting Ticket)后,能够跨域访问Cluster-B中的服务。本文配置的跨域互信是单向的,即Cluster-B无法跨域访问Clu...

2023-11-24
1

「EMR 运维指南」之 Impala 关联 Sentry + Hue

在EMR集群带公网master节点部署sentry服务,Impala的GROUP组需要在Impala server节点上进行创建系统组与之关联。

2023-11-23
1