Databus组成
Relay :数据抓取端
- 读取数据源变更行(ROW),并将变更行数据序列化到内存缓冲区。
- 监听客户端请求并传输缓冲区的数据。
Client:数据客户端
- 检查Relay端的数据变更,并同步数据。
- 如果与Relay之间数据变更相差太大、会执行追溯功能。
注:单个客户端既可以处理全部Databus数据流,也可以作为集群的一部分处理一小部分数据流。
bootstrap-producer:追溯数据生产端
- 这是一个特殊客户端,用于将Relay上的变更数据存储到Mysql数据库。
- Mysql数据库用于追溯数据。
bootstrap-server:追溯数据服务端
- 监听Client端执行追溯的功能请求。
databus-example for Oracle
这里记录运行databus自带的person的example的过程。
- 首先准备Oracle环境,这里我安装的oracle-xe 11g 。管理员密码orale,sid:XE,端口1521。
- databus是用gradle构建的java应用,所以本地首先需要安装gradle环境和java环境。gradle版本>=1.8即可。java版本>=1.6即可。
- 在github上下载databus源代码,解压解压好目录是databus-master。
- 在oracle官网下载ojdbc6.jar重命名放到如下目录:
databus-master/sandbox-repo/com/oracle/ojdbc6/11.2.0.2.0/ojdbc6-11.2.0.2.0.jar
其实做好如上操作即可开始编译了,databus wiki是这么介绍了,不过看有人编译会指定utf-8编码,其实不需要,因为这里不涉及中文。
- 关于gradle版本,如果本地的gradle环境是5以前的,那么无所谓,如果是gradle5需要更改build.gradle文件。
task wrapper(type: Wrapper) {
gradleVersion = '1.8'
}
改为如下,否则编译的时候会报错:Cannot add task ‘wrapper’ as a task with that name already exists
代码语言:javascript复制wrapper {
gradleVersion = '1.8'
}
我本次编译使用版本是gradle5.1(试了最新的5.4.1编译太慢直接放弃了)
- 在com.linkedin.databus2.core.container.netty.ServerContainer的initializeContainerJmx()方法中添加如下内容。这里如果不更改在运行relay的时候会产生Cannot bind to URL rmi://localhost:1099 ServiceUnavailableException错误。
LocateRegistry.createRegistry(_containerStaticConfig.getJmx().getRmiRegistryPort());
最后完整结果:
代码语言:javascript复制 protected void initializeContainerJmx()
{
if (_containerStaticConfig.getJmx().isRmiEnabled())
{
try
{
JMXServiceURL jmxServiceUrl =
new JMXServiceURL("service:jmx:rmi://"
_containerStaticConfig.getJmx().getJmxServiceHost() ":"
_containerStaticConfig.getJmx().getJmxServicePort() "/jndi/rmi://"
_containerStaticConfig.getJmx().getRmiRegistryHost() ":"
_containerStaticConfig.getJmx().getRmiRegistryPort() "/jmxrmi"
_containerStaticConfig.getJmx().getJmxServicePort());
LocateRegistry.createRegistry(_containerStaticConfig.getJmx().getRmiRegistryPort())
_jmxConnServer = JMXConnectorServerFactory.newJMXConnectorServer(jmxServiceUrl, null,
getMbeanServer());
}
catch (Exception e)
{
LOG.warn("Unable to instantiate JMX server", e);
}
}
}
注意首行导包:import java.rmi.registry.LocateRegistry;
- 修改reateUser在第51行
sqlplus sys/oracle@${DBNAME} as sysdba << __EOF__
这里我改为sys/oracle ,这是我的Oracle数据源的sysdba用户名密码。
- 修改sources-person.json,更改第4行,改为我们要连接的数据源信息。这里如果写错了那么运行clien的时候会报数据库连接错误。
{
"name" : "person",
"id" : 1,
"uri" : "jdbc:oracle:thin:person/person@localhost:1521:XE",
"slowSourceQueryThreshold" : 2000,
"sources" :
[
{
"id" : 101,
"name" : "com.linkedin.events.example.person.Person",
"uri": "person.person",
"partitionFunction" : "constant:1"
}
]
}
以上都操作好了即可编译了:
代码语言:javascript复制gradle -Dopen_source=true assemble
java是向下兼容的,我用的jdk8,编译的时候只是会警告有些方法过期而已,是可以成功编译的。 编译好了会在build文件夹下生成很多编译后的文件。
在运行实例之前先要执行数据库脚本以及生成avro序列化文件
- 运行createUser
sh ./db/oracle/bin/createUser.sh person person xe tbs_person /u01/app/oracle/oradata/XE/person/
- 运行createSchema
cd ./db/oracle/fwk
sh /home/databus-master/db/oracle/bin/createSchema.sh person/person@xe /home/databus-master/databus2-example/database/person/
- 生成avro序列化文件
cd /home/databus-master/build/databus2-cmdline-tools-pkg/distributions
tar -zxvf databus2-cmdline-tools-pkg-2.0.0.tar.gz
cd bin
sh dbus2-avro-schema-gen.sh -namespace com.linkedin.events.example.person -recordName Person -viewName "sy$person" -avroOutDir /home/databus-master/myperson-avro/avroOut -avroOutVersion 1 -javaOutDir /home/databus-master/myperson-avro/javaOut -userName person -password person -database jdbc:oracle:thin:@localhost:1521:xe
接下即可运行测试了。
- 运行relay
tar -zxvf build/databus2-example-relay-pkg/distributions/databus2-example-relay-pkg-2.0.0.tar.gz
sh start-example-relay.sh person
- 运行client
tar -zxvf build/databus2-example-client-pkg/distributions/databus2-example-client-pkg-2.0.0.tar.gz
sh start-example-client.sh person
- 开始测试,登录Oracle的person用户执行插入或者更新语句:
INSERT INTO person(id,first_name, last_name,birth_date) VALUES(1,'Trump', 'Donald',sysdate);
update person p set p.BIRTH_DATE = sysdate -100 where p.ID = 1;
- 可以在clien.log看到捕获的信息
但是我发现执行delete语句是无法捕获的,查看数据库脚本发现,databus-example在建立触发器的时候,只建立了inser/update的触发器,没有delete相关的触发器。 继续查文档,看到这个文档Databus-2.0-Client-Event-Model-and-Consumer-API. 其中Data Change Events章节中有提到可以捕获update(包含insert)和delete两个操作应该也是可以捕获的。
到此为止,我们能够捕获Oracle数据库变更的行信息。但需要针对每个表新加字段txn,对每个表建立触发器。但捕获到了的数据不像ogg一样可以直接同步到目标库,目前来看这部分需要写代码单独处理。
网络上关于databus的文章资料比较少,我整理了一下有价值的资料地址,我的实验也参考了下面的文章:
- databus/wiki
- inkedin 的 databus 部署
- databus bootstrap 部署
- Databus架构分析与初步实践(for mysql)(上篇)
- Databus架构分析与初步实践(for mysql)(下篇)
- Databus部分翻译
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/181285.html原文链接:https://javaforall.cn