0

0

Debezium Java嵌入式连接器:解决MySQL数据变更捕获配置问题

霞舞

霞舞

发布时间:2025-11-29 15:22:20

|

316人浏览过

|

来源于php中文网

原创

Debezium Java嵌入式连接器:解决MySQL数据变更捕获配置问题

本文旨在解决使用debezium java嵌入式连接器捕获mysql数据变更时遇到的常见配置问题。重点阐述了`database.include.list`与`table.include.list`的正确用法,并指出`whitelist`属性的弃用。通过优化连接器配置,确保debezium能够准确监控并捕获数据库中的增删改事件,从而实现可靠的变更数据捕获。

Debezium Java嵌入式连接器概述

Debezium是一个开源的分布式平台,用于捕获各种数据库的变更数据(Change Data Capture, CDC)。它通过读取数据库的事务日志(如MySQL的binlog)来实时地捕获数据行级别的变更,并将这些变更事件流式传输到Apache Kafka或其他消息队列。Debezium提供了一个Java嵌入式连接器(Embedded Engine),允许开发者在自己的Java应用程序中直接运行Debezium连接器,无需依赖完整的Kafka Connect集群。

在使用Debezium Java嵌入式连接器时,常见的挑战是正确配置连接器以确保它能够准确地监控并捕获所需数据库或表的数据变更。即使连接成功,如果配置不当,Debezium也可能无法触发相应的事件处理逻辑。

核心配置问题分析

当Debezium连接到MySQL数据库并显示连接成功日志(例如Connected to localhost:3305 at binlog.000008/3443),但却未能捕获到数据变更事件时,问题通常出在连接器的配置上。以下是常见的配置误区:

  1. database.include.list与table.include.list的混淆:

    立即学习Java免费学习笔记(深入)”;

    • database.include.list属性用于指定Debezium应监控的数据库名称列表,其值应为逗号分隔的数据库名(例如db1,db2)。
    • table.include.list属性则用于指定Debezium应监控的表名称列表,其值应为逗号分隔的完全限定表名(例如db1.table1,db2.table2)。
    • 在原始配置中,database.include.list被错误地设置为String.join(",", mysql.getTables()),这实际上是将表名列表传递给了数据库列表属性,导致Debezium无法正确识别要监控的数据库。
  2. database.whitelist和table.whitelist属性的弃用:

    • 在Debezium的早期版本中,曾使用database.whitelist和table.whitelist来指定包含列表。然而,这些属性在较新的Debezium版本中已被弃用并移除,取而代之的是database.include.list、database.exclude.list、table.include.list和table.exclude.list。
    • 原始配置中同时使用了database.whitelist和table.whitelist,并将其值设置为mysql.*。这不仅使用了已弃用的属性,而且其值也可能与database.include.list的意图冲突,进一步导致配置混乱。

正确的配置实践

为了确保Debezium能够正确捕获MySQL的数据变更,我们需要根据其设计意图来配置database.include.list和table.include.list。

假设我们希望监控名为my_application_db数据库中的user表。

示例代码:优化Debezium连接器配置

以下是DebeziumConfigLoader.load方法的优化版本,展示了如何正确配置Debezium MySQL连接器:

RecoveryFox AI
RecoveryFox AI

AI驱动的数据恢复、文件恢复工具

下载
import io.debezium.config.Configuration;
import java.util.Properties;

public class DebeziumConfigLoader {

    public static Configuration load(Connection connection) {
        final MysqlConnection mysql = connection.getMysqlConnection();

        // 获取要监控的数据库名称
        String databaseToMonitor = mysql.getDbName(); 
        // 获取要监控的表名称列表,例如 "my_application_db.user"
        // 假设 mysql.getTables() 返回的是 "user"
        String tablesToMonitor = databaseToMonitor + "." + String.join("," , mysql.getTables());

        return Configuration.create()
                .with("name", "customer-mysql-connector")
                .with("connector.class", "io.debezium.connector.mysql.MySqlConnector")
                .with("offset.storage", "org.apache.kafka.connect.storage.FileOffsetBackingStore")
                .with("offset.flush.interval.ms", "60000")
                .with("database.hostname", mysql.getHost())
                .with("database.port", mysql.getPort())
                .with("database.user", mysql.getUsername())
                .with("database.password", mysql.getPassword())
                // 正确配置:指定要监控的数据库名称
                .with("database.include.list", databaseToMonitor) 
                // 正确配置:指定要监控的完全限定表名称
                .with("table.include.list", tablesToMonitor) 
                .with("include.schema.changes", "false")
                .with("database.server.id", "10181") // 确保此ID在所有Debezium连接器实例中唯一
                .with("database.server.name", "customer-mysql-db-server")
                .with("database.history", "io.debezium.relational.history.FileDatabaseHistory")
                .with("database.history.file.filename", "/tmp/dbhistory.dat")
                .with("offset.storage.file.filename", "/tmp/offsets.dat")
                // 移除已弃用的 'database.whitelist' 和 'table.whitelist'
                // .with("database.whitelist", "mysql.*") // 此行应被移除
                // .with("table.whitelist", "mysql.*")    // 此行应被移除
                .build();
    }
}

关键修改点:

  • database.include.list: 现在只包含实际的数据库名称(例如my_application_db)。
  • table.include.list: 现在包含完全限定的表名(例如my_application_db.user)。如果mysql.getTables()返回的是不带数据库名的表名,需要手动拼接。
  • 移除database.whitelist和table.whitelist: 避免使用已弃用的属性,并消除潜在的配置冲突。

注意事项与最佳实践

  1. Debezium版本兼容性: 始终查阅您所使用的Debezium版本的官方文档,以了解最新的配置属性和任何弃用信息。属性名称和行为可能在不同版本之间发生变化。

  2. MySQL用户权限: 确保Debezium连接的MySQL用户拥有足够的权限来读取binlog和访问被监控的数据库和表。通常需要REPLICATION SLAVE和SELECT权限。

  3. MySQL Binlog配置:

    • MySQL的log_bin必须开启。
    • binlog_format应设置为ROW,这是Debezium捕获详细变更所必需的。
    • server_id在MySQL服务器配置中必须是唯一的,并且Debezium连接器配置中的database.server.id也必须是唯一的,且与MySQL服务器的server_id不同。
  4. database.server.id的唯一性: database.server.id用于Debezium标识自身在MySQL复制协议中的从属ID。如果运行多个Debezium连接器实例(即使是不同的应用程序),每个实例都必须配置一个唯一的database.server.id,以避免与MySQL复制协议中的其他从库或Debezium实例冲突。

  5. 偏移量存储 (offset.storage) 和数据库历史 (database.history):

    • offset.storage用于持久化Debezium已处理的binlog位置。当应用程序重启时,Debezium可以从上次中断的地方继续捕获事件,避免数据丢失或重复。在嵌入式模式下,FileOffsetBackingStore是一个简单的选择,但生产环境可能考虑使用更健壮的存储,如数据库。
    • database.history用于存储数据库模式(schema)变更的历史。这对于Debezium正确解析变更事件至关重要。FileDatabaseHistory同样适用于简单场景,但生产环境可能需要考虑Kafka或其他持久化存储
    • 确保offset.storage.file.filename和database.history.file.filename指向的路径是可写且持久化的,以防止应用程序重启后丢失状态。

总结

Debezium Java嵌入式连接器为应用程序集成CDC功能提供了强大而灵活的方式。然而,其有效性高度依赖于准确的配置。通过理解database.include.list和table.include.list的正确用法,避免使用已弃用的属性,并关注MySQL的binlog配置和Debezium的持久化机制,开发者可以确保Debezium能够可靠地捕获数据库变更事件,从而构建出响应式和数据驱动的应用程序。在遇到事件未捕获问题时,仔细检查这些配置项是解决问题的关键。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

668

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

247

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

281

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

515

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

256

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

386

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

533

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

602

2023.08.14

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 812人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号