Python 指定offset 读取消息（Kafka-Pytho

作者: HAO延WEI | 来源:发表于2020-08-06 10:56 被阅读0次

Python 指定offset 读取消息（Kafka-Pytho
定位消息
Kafka多分区下二分法查找指定时间戳的offset
xlrd如何读取Excel单个cell表格的详细格式信息
kafka offset的存储
Recording Code 0
Flink kafka source源码解析(四)
kafka 基于Partition 和group 消费,kafk
[PHP源码阅读]strpos、strstr和stripos、s
python读取文件

# -*- coding: utf-8 -*-

"""
Create by Mr.Hao on 2019/12/6.

"""

#pip install kafka-python
import hashlib
import os
import time
import pymysql
import json
import requests
from kafka import KafkaConsumer
from kafka import TopicPartition

consumer = KafkaConsumer(
    bootstrap_servers = "127.0.0.1:9092", # kafka集群地址
    group_id = "newConsumerTest1", # 消费组id
    client_id = '8eaa8c81edfd41f28a50f9121ad14572',
    auto_offset_reset="latest",
    max_poll_records=10, # 每次最大消费数量
    enable_auto_commit = True, # 每过一段时间自动提交所有已消费的消息（在迭代时提交）
    auto_commit_interval_ms = 5000, # 自动提交的周期（毫秒）
)

partition = TopicPartition('auto_datacenter_spider_snapshot', 4)
res = consumer.poll(10)
start = 20905270
end = 20905280
consumer.assign([partition])
consumer.seek(partition, offset=start)
#consumer.seek_to_end() 默认读取最新数据
for msg in consumer: # 迭代器，等待下一条消息
    offset, value = msg.offset, msg.value
    if msg.offset > end:
        break

    jdate = json.loads(value)
    print offset,"====>>>>",jdate.get("crawler_time"), jdate.get("taskId")," url_md5:", jdate.get("url_md5")

网友评论

本文标题：Python 指定offset 读取消息（Kafka-Pytho

本文链接：https://www.haomeiwen.com/subject/uqrzrktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python 指定offset 读取消息（Kafka-Pytho

相关文章

Python 指定offset 读取消息（Kafka-Pytho

定位消息

Kafka多分区下二分法查找指定时间戳的offset

xlrd如何读取Excel单个cell表格的详细格式信息

kafka offset的存储

Recording Code 0

Flink kafka source源码解析(四)

kafka 基于Partition 和group 消费,kafk

[PHP源码阅读]strpos、strstr和stripos、s

python读取文件

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读