From 2be608f7f019d6fafa0b875c9dff6cea8fa4967e Mon Sep 17 00:00:00 2001 From: Xingyu Wang Date: Wed, 29 Jun 2022 09:54:35 +0800 Subject: [PATCH] RP @lkxed https://linux.cn/article-14772-1.html --- ...chronous Messaging for Seamless Systems.md | 52 ++++++++++--------- 1 file changed, 27 insertions(+), 25 deletions(-) rename {translated/tech => published}/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md (83%) diff --git a/translated/tech/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md b/published/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md similarity index 83% rename from translated/tech/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md rename to published/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md index e61f4f1829..3882caa3a3 100644 --- a/translated/tech/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md +++ b/published/20211102 Apache Kafka- Asynchronous Messaging for Seamless Systems.md @@ -3,42 +3,44 @@ [#]: author: "Krishna Mohan Koyya https://www.opensourceforu.com/author/krishna-mohan-koyya/" [#]: collector: "lkxed" [#]: translator: "lkxed" -[#]: reviewer: " " -[#]: publisher: " " -[#]: url: " " +[#]: reviewer: "wxy" +[#]: publisher: "wxy" +[#]: url: "https://linux.cn/article-14772-1.html" Apache Kafka:为“无缝系统”提供异步消息支持 ====== -Apache Kafka 是最流行的开源消息代理之一。它已经成为了大数据操作的重要组成部分,你能够在几乎所有的微服务环境中找到它。本文对 Apache Kafka 进行了简要介绍,并提供了一个案例来展示它的使用方式。 -![][1] +> Apache Kafka 是最流行的开源消息代理之一。它已经成为了大数据操作的重要组成部分,你能够在几乎所有的微服务环境中找到它。本文对 Apache Kafka 进行了简要介绍,并提供了一个案例来展示它的使用方式。 + +![](https://img.linux.net.cn/data/attachment/album/202206/29/094326fbo6zzsrxiava661.jpg) 你有没有想过,电子商务平台是如何在处理巨大的流量时,做到不会卡顿的呢?有没有想过,OTT 平台是如何在同时向数百万用户交付内容时,做到平稳运行的呢?其实,关键就在于它们的分布式架构。 -采用分布式架构设计的系统由多个功能组件组成。这些功能组件通常分布在许多个机器上,它们通过网络,异步地交换消息,从而实现相互协作。正是由于异步消息的存在,组件之间才能实现可伸缩、无阻塞的通信,整个系统才能够平稳运行。 +采用分布式架构设计的系统由多个功能组件组成。这些功能组件通常分布在多个机器上,它们通过网络,异步地交换消息,从而实现相互协作。正是由于异步消息的存在,组件之间才能实现可伸缩、无阻塞的通信,整个系统才能够平稳运行。 ### 异步消息 异步消息的常见特性有: -* 消息的生产者和消费者都不知道彼此的存在。它们在不知道其他对象的情况下,加入和离开系统。 -* 消息代理充当了生产者和消费者之间的中介。 -* 生产者把每条消息,都与一个“主题”topic相关联。每个主题只是一个简单的字符串。 -* 一个生产者可以把消息发往多个主题,不同生产者也可以把消息发送给同一主题。 +* 消息的生产者producer消费者consumer都不知道彼此的存在。它们在不知道对方的情况下,加入和离开系统。 +* 消息代理broker充当了生产者和消费者之间的中介。 +* 生产者把每条消息,都与一个“主题topic”相关联。主题是一个简单的字符串。 +* 生产者可以在多个主题上发送消息,不同的生产者也可以在同一主题上发送消息。 * 消费者向代理订阅一个或多个主题的消息。 * 生产者只将消息发送给代理,而不发送给消费者。 * 代理会把消息发送给订阅该主题的所有消费者。 +* 代理将消息传递给针对该主题注册的所有消费者。 * 生产者并不期望得到消费者的任何回应。换句话说,生产者和消费者不会相互阻塞。 -市场上的消息代理有很多,而 Apache Kafka 是其中最受欢迎的一种(之一)。 +市场上的消息代理有很多,而 Apache Kafka 是其中最受欢迎的之一。 ### Apache Kafka -Apache Kafka 是一个支持流处理的、开源的分布式消息系统,它由 Apache 软件基金会开发。在架构上,它是多个代理组成的集群,这些代理间通过 Apache ZooKeeper 服务来协调。在接收、持久化和发送消息时,这些代理共享集群上的负载。 +Apache Kafka 是一个支持流式处理的、开源的分布式消息系统,它由 Apache 软件基金会开发。在架构上,它是多个代理组成的集群,这些代理间通过 Apache ZooKeeper 服务来协调。在接收、持久化和发送消息时,这些代理分担集群上的负载。 #### 分区 -Kafka 将消息写入称为“分区”partitions的桶中。一个特定分区只保存一个主题上的消息。例如,Kafka 会把 `heartbeats` 主题上的消息写入名为 “heartbeats-0” 的分区(假设它是个单分区主题),这个过程和生产者无关。 +Kafka 将消息写入称为“分区partition”的桶中。一个特定分区只保存一个主题上的消息。例如,Kafka 会把 `heartbeats` 主题上的消息写入名为 `heartbeats-0` 的分区(假设它是个单分区主题),这个过程和生产者无关。 ![图 1:异步消息][2] @@ -50,21 +52,21 @@ Kafka 将消息写入称为“分区”partitions的桶中 #### 领导者和同步副本 -Kafka 在(由多个代理组成的)集群中维护了多个分区。其中,负责维护分区的那个代理被称为“领导者”leader。只有领导者能够在它的分区上接收和发送消息。 +Kafka 在(由多个代理组成的)集群中维护了多个分区。其中,负责维护分区的那个代理被称为“领导者leader”。只有领导者能够在它的分区上接收和发送消息。 可是,万一分区的领导者发生故障了,又该怎么办呢?为了确保业务连续性,每个领导者(代理)都会把它的分区复制到其他代理上。此时,这些其他代理就称为该分区的同步副本in-sync-replicas(ISR)。一旦分区的领导者发生故障,ZooKeeper 就会发起一次选举,把选中的那个同步副本任命为新的领导者。此后,这个新的领导者将承担该分区的消息接受和发送任务。管理员可以指定分区需要维护的同步副本的大小。 -![图 3:命令行生产者][4] +![图 3:生产者命令行工具][4] #### 消息持久化 代理会将每个分区都映射到一个指定的磁盘文件,从而实现持久化。默认情况下,消息会在磁盘上保留一个星期。当消息写入分区后,它们的内容和顺序就不能更改了。管理员可以配置一些策略,如消息的保留时长、压缩算法等。 -![图 4:命令行消费者][5] +![图 4:消费者命令行工具][5] #### 消费消息 -与大多数其他消息系统不同,Kafka 不会主动将消息发送给消费者。相反,消费者应该监听主题,并主动读取消息。一个消费者可以某个主题的多个分区中读取消息。多个消费者也可以读取来自同一个分区的消息。Kafka 保证了同一条消息不会被同一个消费者重复读取。 +与大多数其他消息系统不同,Kafka 不会主动将消息发送给消费者。相反,消费者应该监听主题,并主动读取消息。一个消费者可以从某个主题的多个分区中读取消息。多个消费者也可以读取来自同一个分区的消息。Kafka 保证了同一条消息不会被同一个消费者重复读取。 Kafka 中的每个消费者都有一个组 ID。那些组 ID 相同的消费者们共同组成了一个消费者组。通常,为了从 N 个主题分区读取消息,管理员会创建一个包含 N 个消费者的消费者组。这样一来,组内的每个消费者都可以从它的指定分区中读取消息。如果组内的消费者比可用分区还要多,那么多出来的消费者就会处于闲置状态。 @@ -116,9 +118,9 @@ listeners=PLAINTEXT://:9092 上述命令还同时指定了复制因子replication factor,它的值不能大于集群中代理的数量。我们使用的是单代理集群,因此,复制因子只能设置为 1。 -当主题创建完成后,生产者和消费者就可以在上面交换消息了。Kafka 的发行版内附带了命令行工具生产者和消费者,供测试时用。 +当主题创建完成后,生产者和消费者就可以在上面交换消息了。Kafka 的发行版内附带了生产者和消费者的命令行工具,供测试时用。 -打开第三个终端,运行下面的命令,启动命令行生产者: +打开第三个终端,运行下面的命令,启动生产者: ``` ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic topic-1 @@ -126,7 +128,7 @@ listeners=PLAINTEXT://:9092 上述命令显示了一个提示符,我们可以在后面输入简单文本消息。由于我们指定的命令选项,生产者会把 `topic-1` 上的消息,发送到运行在本机的 9092 端口的 Kafka 中。 -打开第四个终端,运行下面的命令,启动命令行消费者: +打开第四个终端,运行下面的命令,启动消费者: ``` ./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic topic-1 –-from-beginning @@ -146,7 +148,7 @@ listeners=PLAINTEXT://:9092 ![图 5:基于 Kafka 的架构][6] -在这种架构下,客车上的设备扮演了消息生产者的角色。它们会周期性地把当前位置发送到 Kafka 的 `abc-bus-location` 主题上。ABC 公司选择以客车的行程码trip code作为消息键,以处理来自不同客车的消息。例如,对于从 Bengaluru 到 Hubballi 的客车,它的行程码就会是 `BLRHL003`,那么在这段旅程中,对于所有来自该客车的消息,它们的消息键都会是 `BLRHL003`。 +在这种架构下,客车上的设备扮演了消息生产者的角色。它们会周期性地把当前位置发送到 Kafka 的 `abc-bus-location` 主题上。ABC 公司选择以客车的行程编号trip code作为消息键,以处理来自不同客车的消息。例如,对于从 Bengaluru 到 Hubballi 的客车,它的行程编号就会是 `BLRHL003`,那么在这段旅程中,对于所有来自该客车的消息,它们的消息键都会是 `BLRHL003`。 仪表盘应用扮演了消息消费者的角色。它在代理上注册了同一个主题 `abc-bus-location`。如此,这个主题就成为了生产者(客车)和消费者(仪表盘)之间的虚拟通道。 @@ -166,7 +168,7 @@ listeners=PLAINTEXT://:9092 ##### Java 生产者 -下面的 `Fleet` 类模拟了在 ABC 公司的 6 辆客车上运行的 Kafka 生产者应用。它会把位置更新发送到指定代理的 `abc-bus-location` 主题上。请注意,简单起见,主题名称、消息键、消息内容和代理地址等,都在代码里写死了。 +下面的 `Fleet` 类模拟了在 ABC 公司的 6 辆客车上运行的 Kafka 生产者应用。它会把位置更新发送到指定代理的 `abc-bus-location` 主题上。请注意,简单起见,主题名称、消息键、消息内容和代理地址等,都在代码里硬编码的。 ``` public class Fleet { @@ -205,7 +207,7 @@ public class Fleet { ##### Java 消费者 -下面的 `Dashboard` 类实现了一个 Kafka 消费者应用,运行在 ABC 公司的操作中心。它会监听 `abc-bus-location` 主题,并且它的消费者组 ID 是 `abc-dashboard`。当收到消息后,它会立即显示来自客车的详细位置信息。我们本该配置这些详细位置信息,但简单起见,它们也是在代码里写死的: +下面的 `Dashboard` 类实现了一个 Kafka 消费者应用,运行在 ABC 公司的操作中心。它会监听 `abc-bus-location` 主题,并且它的消费者组 ID 是 `abc-dashboard`。当收到消息后,它会立即显示来自客车的详细位置信息。我们本该配置这些详细位置信息,但简单起见,它们也是在代码里硬编码的: ``` public static void main(String[] args) { @@ -241,7 +243,7 @@ public static void main(String[] args) { ##### 依赖 -为了编译和运行这些代码,我们需要 JDK 8 及以上版本。看到下面的 `pom.xml` 文件中的 Maven 依赖了吗?它们会把所需的 Kafka 客户端库,下载并添加到类路径中: +为了编译和运行这些代码,我们需要 JDK 8 及以上版本。看到下面的 `pom.xml` 文件中的 Maven 依赖了吗?它们会把所需的 Kafka 客户端库下载并添加到类路径中: ``` @@ -283,7 +285,7 @@ via: https://www.opensourceforu.com/2021/11/apache-kafka-asynchronous-messaging- 作者:[Krishna Mohan Koyya][a] 选题:[lkxed][b] 译者:[lkxed](https://github.com/lkxed) -校对:[校对者ID](https://github.com/校对者ID) +校对:[wxy](https://github.com/wxy) 本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出