Confluent Kafka Python 生产者简介


如今,数据是数字生态系统的重要组成部分,每个现代应用程序都依赖于其有效管理和处理。对于这个数据驱动的时代,Apache Kafka,一种强大的事件流技术,提供了一种高吞吐量的解决方案。使用 Confluent 的 Apache Kafka Python 客户端,这些强大的功能可以无缝集成到您的 Python 应用程序中。本文全面概述了 Confluent Kafka Python 生产者,并包含一些有用的示例来帮助您入门。

什么是 Confluent Kafka Python 生产者?

Confluent Kafka Python 客户端库的一个组件,Confluent Kafka Python 生产者为 Apache Kafka 的强大数据流功能提供了 Python 风格的接口。它与 Kafka 消费者一起使用,使 Python 程序能够通过向 Kafka 主题发送数据来充分参与基于 Kafka 的分布式系统。

开始使用 Confluent Kafka Python 生产者

可以使用 Python 的包安装程序 Pip 安装 Confluent Kafka Python 生产者。要安装,请执行以下命令:

pip install confluent-kafka

安装后,您可以在 Python 脚本中导入 Kafka 生产者

from confluent_kafka import Producer

将 Confluent Kafka Python 生产者投入使用

现在让我们来探索如何使用 Confluent Kafka Python 生产者向 Kafka 发送消息。

示例 1:生成简单消息

以下是如何创建对 Kafka 主题的直接响应:

from confluent_kafka import Producer

p = Producer({'bootstrap.servers': 'localhost:9092'})

p.produce('mytopic', 'Hello, Kafka!')

p.flush()

此脚本通过创建 Kafka 生产者建立与 localhost:9092 上的 Kafka 代理的连接。为了确保消息已发送,它首先将消息“Hello, Kafka!”发送到主题“mytopic”,然后刷新生产者的消息队列。

示例 2:处理消息传递报告

此外,Confluent Kafka 生产者还可以报告消息传递到其主题的成功情况:

from confluent_kafka import Producer

def delivery_report(err, msg):
   if err is not None:
      print(f'Message delivery failed: {err}')
   else:
      print(f'Message delivered to {msg.topic()} [{msg.partition()}]')

p = Producer({'bootstrap.servers': 'localhost:9092'})

p.produce('mytopic', 'Hello, Kafka!', callback=delivery_report)

p.flush()

在这里,当回调函数 delivery_report 被调用时,该函数是 produce 方法的一部分,消息将被给出。

示例 3:生成键值消息

Kafka 消息通常包含键和值。以下是如何创建键值消息:

from confluent_kafka import Producer

p = Producer({'bootstrap.servers': 'localhost:9092'})

p.produce('mytopic', key='mykey', value='myvalue')

p.flush()

此脚本为主题“mytopic”生成一条消息,其键为“mykey”,值为“myvalue”。

示例 4:生成 Avro 消息

借助数据序列化技术 Avro,您可以加密消息的模式。这在为一个主题创建消息时特别有用,该主题将被多个消费者使用,每个消费者可能需要不同的格式。要创建 Avro 消息,请按照以下步骤操作:

from confluent_kafka import avro, Producer
from confluent_kafka.avro import AvroProducer

value_schema = avro.load('value_schema.avsc')
key_schema = avro.load('key_schema.avsc')
value = {"name": "Value"}
key = {"name": "Key"}

avroProducer = AvroProducer({
   'bootstrap.servers': 'localhost:9092', 
   'schema.registry.url': 'http://127.0.0.1:8081'
   }, default_key_schema=key_schema, default_value_schema=value_schema)

avroProducer.produce(topic='my_topic', value=value, key=key)
avroProducer.flush()

此脚本为主题“my_topic”创建一条消息,其键和值符合提供的 Avro 模式。

示例 5:配置消息压缩

为了节省带宽,您可以将 Kafka 生产者配置为在发送消息之前压缩消息。以下是一个示例:

from confluent_kafka import Producer

p = Producer({
   'bootstrap.servers': 'localhost:9092',
   'compression.type': 'gzip',
})

p.produce('mytopic', 'Hello, Kafka!')
p.flush()

此脚本创建了一个 Kafka 生产者,它使用 gzip 在将消息传递到主题之前压缩消息。

结论

Confluent 的 Kafka Python 生产者是一个强大且高度适应性的解决方案,使 Python 应用程序能够利用 Kafka 强大的数据流功能。无论您是构建复杂的分布式系统,还是只需要可靠的数据流,它都是一个重要的工具。

本全面分析涵盖了从安装到在 Python 应用程序中实际使用的一切内容。我们详细介绍了五个示例:构建简单消息、处理传递报告、生成键值消息、构建 Avro 消息以及自定义消息压缩。

但请记住,Confluent 的 Kafka Python 生产者提供的功能远远不止本书中介绍的内容。我们建议您查阅官方 Confluent 文档并继续进行实验以进行高级使用,例如与 Kafka Streams 集成或开发自定义序列化器。

更新于: 2023年7月17日

1K+ 浏览量

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告