如何挑选十大拿货网站,打造个人博客?

摘要:自己做的博客网站吗,十大拿货网站,辽宁省建设厅官方网站,网站广告怎么赚钱1.CDC概述 CDC(Change Data Capture)是一种用于捕获和处理数据源中的变化的技术。它
自己做的博客网站吗,十大拿货网站,辽宁省建设厅官方网站,网站广告怎么赚钱1.CDC概述 CDC#xff08;Change Data Capture#xff09;是一种用于捕获和处理数据源中的变化的技术。它允许实时地监视数据库或数据流中发生的数据变动#xff0c;并将这些变动抽取出来#xff0c;以便进行进一步的处理和分析。 传统上#xff0c;数据源的变化通常通过…1.CDC概述 CDCChange Data Capture是一种用于捕获和处理数据源中的变化的技术。它允许实时地监视数据库或数据流中发生的数据变动并将这些变动抽取出来以便进行进一步的处理和分析。 传统上数据源的变化通常通过周期性地轮询整个数据集进行检查来实现。但是这种轮询的方式效率低下且不能实时反应变化。而 CDC 技术则通过在数据源上设置一种机制使得变化的数据可以被实时捕获并传递给下游处理系统从而实现了实时的数据变动监控。 Flink 作为一个强大的流式计算引擎提供了内置的 CDC 功能能够连接到各种数据源如数据库、消息队列等捕获其中的数据变化并进行灵活的实时处理和分析。 通过使用 Flink CDC我们可以轻松地构建实时数据管道对数据变动进行实时响应和处理为实时分析、实时报表和实时决策等场景提供强大的支持。 2.CDC 的实现原理 通常来讲CDC 分为主动查询和事件接收两种技术实现模式。对于主动查询而言用户通常会在数据源表的某个字段中保存上次更新的时间戳或版本号等信息然后下游通过不断的查询和与上次的记录做对比来确定数据是否有变动是否需要同步。这种方式优点是不涉及数据库底层特性实现比较通用缺点是要对业务表做改造且实时性不高不能确保跟踪到所有的变更记录且持续的频繁查询对数据库的压力较大。事件接收模式可以通过触发器Trigger或者日志例如 Transaction log、Binary log、Write-ahead log 等来实现。当数据源表发生变动时会通过附加在表上的触发器或者 binlog 等途径将操作记录下来。下游可以通过数据库底层的协议订阅并消费这些事件然后对数据库变动记录做重放从而实现同步。这种方式的优点是实时性高可以精确捕捉上游的各种变动缺点是部署数据库的事件接收和解析器例如 Debezium、Canal 等有一定的学习和运维成本对一些冷门的数据库支持不够。综合来看事件接收模式整体在实时性、吞吐量方面占优如果数据源是 MySQL、PostgreSQL、MongoDB 等常见的数据库实现建议使用Debezium来实现变更数据的捕获下图来自Debezium 官方文档如果使用的只有 MySQL则还可以用Canal。 3.为什么选 Flink 从上图可以看到Debezium 官方架构图中是通过 Kafka Streams 直接实现的 CDC 功能。而我们这里更建议使用 Flink CDC 模块因为 Flink 相对 Kafka Streams 而言有如下优势 强大的流处理引擎 Flink 是一个强大的流处理引擎具备高吞吐量、低延迟、Exactly-Once 语义等特性。它通过基于事件时间的处理模型支持准确和有序的数据处理适用于实时数据处理和分析场景。这使得 Flink 成为实现 CDC 的理想选择。 内置的 CDC 功能 Flink 提供了内置的 CDC 功能可以直接连接到各种数据源捕获数据变化并将其作为数据流进行处理。这消除了我们自行开发或集成 CDC 解决方案的需要使得实现 CDC 变得更加简单和高效。 多种数据源的支持 Flink CDC 支持与各种数据源进行集成如关系型数据库如MySQL、PostgreSQL、消息队列如Kafka、RabbitMQ、文件系统等。这意味着无论你的数据存储在哪里Flink 都能够轻松地捕获其中的数据变化并进行进一步的实时处理和分析。 灵活的数据处理能力 Flink 提供了灵活且强大的数据处理能力可以通过编写自定义的转换函数、处理函数等来对 CDC 数据进行各种实时计算和分析。同时Flink 还集成了 SQL 和 Table API为用户提供了使用 SQL 查询语句或 Table API 进行简单查询和分析的方式。 完善的生态系统 Flink 拥有活跃的社区和庞大的生态系统这意味着你可以轻松地获取到丰富的文档、教程、示例代码和解决方案。此外Flink 还与其他流行的开源项目如Apache Kafka、Elasticsearch深度集成提供了更多的功能和灵活性。
阅读全文