最新 最热

使用Flume实现MySQL与Kafka实时同步

http://www.apache.org/dyn/closer.lua/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz https://github.com/keedio/flume-ng-sql-source/archive/v1.5.2.tar.gz

2023-08-17
1

MySQL与Hadoop数据同步方案:Sqoop与Flume的应用探究【上进小菜猪大数据系列】

随着大数据技术的发展,越来越多的企业开始采用分布式系统和云计算技术来处理和存储海量数据。Hadoop是一种开源的分布式系统,可用于存储和处理大规模数据集。MySQL则是最受欢迎的关系型数据库之一,它被广泛应用于企业级...

2023-05-09
2

Linux环境下Flume的安装

1、在官网http://flume.apache.org/download.html下载flume的压缩包

2022-12-01
1

vivo大数据日志采集Agent设计实践

在企业大数据体系建设过程中,数据采集是其中的首要环节。然而,当前行业内的相关开源数据采集组件,并无法满足企业大规模数据采集的需求与有效的数据采集治理,所以大部分企业都采用自研开发采集组件的方式。本文通过在vivo...

2022-11-28
1

Kafka扩展内容

Intercetpor的实现接口是org.apache.kafka.clients.producer.ProducerInterceptor。

2022-10-25
1

Flume快速入门系列(11) | Flume知识点总结(持续更新)

增加Source个数(使用Tair Dir Source时可增加FileGroups个数)可以增大Source的读取数据的能力。例如:当某一个目录产生的文件过多时需要将这个文件目录拆分成多个文件目录,同时配置好多个Source 以保证Source有足够的能力...

2020-10-28
1

flume-kafka-storm-hdfs-hadoop-hbase

# bigdata-demo项目地址:https://github.com/windwant/bigdata-servicehadoop: hadoop hdfs操作 log输出到flume flume输出到hdfshbase: HTable基本操作:创建,删除,添加表......

2020-09-11
1

经典面试题-Flume的Channel Selectors

Flume的Channel Selectors.

2020-03-25
0

经典面试题-Flume参数调优

Flume参数调优Source 增加Source个(使用Tair Dir Source时可增加FileGroups个数)可以增大Source的读取数据的能力。例如:当某一个目录产生的文件过多时需要将这个文件目录拆分成多个文件目录,同时配置好多个Source 以保证...

2020-03-24
1

快速学习-Flume概述

Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。

2020-02-18
1