最新 最热

图解大数据 | 实操案例-MapReduce大数据统计

教程地址:http://www.showmeai.tech/tutorials/84

2022-03-08
1

Kafka的使用场景/基本概念/初体验

创建一个名字为“test”的Topic,这个topic只有一个partition,并且备份因子也设置为1。当producer发布一个消息到某个指定的Topic,这个Topic如果不存在,就自动创建。...

2022-03-07
1

第12章 大数据分析(R和Hadoop) 笔记

RHadoop是R支持Hadoop大数据分析和处理提供的算法包合集。传统统计学主要关注样本数据(小数据集)的分析,可能忽略发生概率极小单导致不确定性的结果。当数据量大到一台机器无法处理时,只能求助于超算或者Hadoop这样的可扩...

2022-03-04
1

奈学科技技术开放日 | 《Hadoop3纠删码容错技术原理和实战》等你免费学!

好的开始等于成功的一半,2022给自己一个美好的期许! 为了感谢2021年广大技术人对奈学科技的关注和支持,在2022新年开篇之际,奈学科技的核心教研团队将于1月11日特别推出【奈学科技技术开放日】免费体验学习活动,以高含金...

2022-03-03
1

智能计算时代 | SuperSQL基于监督学习模型的自适应计算提效能力

点击蓝字 关注我们更多咨询 天穹SuperSQL是腾讯自研、基于统一SQL语言模型、面向机器学习智能调优、提供虚拟化数据和开放式计算引擎的大数据智能融合平台。在开放融合的Data Cloud上,业务方可以消费完整的数据生命周...

2022-03-03
1

将hudi同步到配置kerberos的hive3

前人种树,后人乘凉。本文基于社区pr:https://github.com/apache/hudi/pull/3771 ,新增一些其他配置项以完成本场景下的hudi → hive metastore元数据同步问题。

2022-03-03
1

hadoop之yarn(优化篇)

最近一直在学习hadoop的一些原理和优化,然后也做了一些实践,也有没有去做实践的,反正个人观点都记录下来

2022-03-01
1

客快物流大数据项目(四十九):开发环境初始化

目录开发环境初始化一、配置开发环境的HADOOP_HOME二、​​​​​​​将hadoop.dll拷贝到System32目录开发环境初始化一、​​​​​​​配置开发环境的HADOOP_HOME将:软件大数据服务器所需软件etl开发所需文件hado...

2022-02-28
1

机器学习服务器文档

在具有多个内核的单个服务器上,作业并行运行,假设工作负载可以分成更小的部分并在多个线程上执行。

2022-02-27
1

每个计算上下文的数据源

在数据源类型中,您可能会发现取决于文件系统类型和计算上下文的差异。例如,在 Hadoop 分布式文件系统 (HDFS) 上创建的 .xdf 文件与在 Windows 或 Linux 等非分布式文件系统中创建的 .xdf 文件有些不同。有关详细信息,请...

2022-02-27
1