美文网首页
Kafka使用中的两个问题总结

Kafka使用中的两个问题总结

作者: petergz | 来源:发表于2017-04-03 00:45 被阅读2103次

Kafka用了挺长时间了,最早时官方文档也看得挺细的,但结果大半年没用,最近在做一些部署调整的时候有些细节居然遗忘了,摆了个乌龙。在这里总结一下,以免再忘。

1. 给Kafka加负载均衡的问题

Kafka producer上传数据的工作原理:

  1. producer先通过配置的broker列表中的其中一台,获取到整个Kafka集群的metadata,其中包含brokers,topics,partitions包括ISR的信息。定期update。
  2. 根据以上的metadata,以及由配置的message_key决定的partitioner策略(默认不配message_key的话就是简单的round robin),producer决定将数据分批发送到某个broker的partition中。
  3. producer直接发送数据,不再经过producer配置中的broker转发。

因此,加负载均衡是对获取metadata的请求提供了高可用,但不是对实际数据发送做负载均衡。所以流量很小,不需要考虑负载均衡服务器的带宽。

2. host.name与advertised.host.name的设置

host.name:按配置文件说明,是Kafka绑定的interface。其实这个说明有点误导,下面会见到。

advertised.host.name:是注册到zookeeper,client要访问的broker地址。(可能producer也是拿这个值,没有验证)

如果advertised.host.name没有设,会用host.name的值注册到zookeeper,如果host.name也没有设,则会使用JVM拿到的本机hostname注册到zk。

这里有两个坑要注意:

  1. 如果advertised.host.name没有设,host.name不能设为0.0.0.0,否则client通过zk拿到的broker地址就是0.0.0.0。
    如果指定要bind到所有interface,host.name不设就可以。

  2. 如果host.name和advertised.host.name都不设,client通过zk拿到的就是JVM返回的本机hostname,如果这个hostname是client无法访问到的,client就会连不上broker
    所以如果要bind到所有interface,client又能访问,解决的办法是host.name不设或设置0.0.0.0,advertised.host.name一定要设置为一个client可以访问的地址,如直接设IP地址。
    如果不需要bind到所有interface,也可以只在host.name设置IP地址。

简单的检查broker是否可以被client访问到的办法,就是在zookeeper中看broker信息,上面显示的hostname是否是client可以访问到的地址。
在zkCli中执行get /brokers/<id>

【扩展】为何producer是配置broker地址而consumer中是配置zookeeper地址

区别的原因是consumer要把consumer group和consumer的信息(主要是分配了哪些topic/partition)注册到zookeeper中,被各个consumer watch,以实现consumer之间的自动均衡。

至于consumer的offset虽然也可能保存在zookeeper上,但不是区别的原因。因为在0.9版本以上,offset也是可以保存到Kafka本身的。
</br>

相关文章

  • Kafka使用中的两个问题总结

    Kafka用了挺长时间了,最早时官方文档也看得挺细的,但结果大半年没用,最近在做一些部署调整的时候有些细节居然遗忘...

  • Druid:Integration with Kafka

    本文介绍在Kafka和Druid整合使用中遇到的问题和解决方法。 1. 基本配置 Druid使用Kafka作为数据...

  • Kafka实际使用过程中遇到的一些问题及解决方法

    Kafka实际使用过程中遇到的一些问题及解决方法: 1.关于Kafka的分区: 开始使用Kafka的时候,没有分区...

  • kafka学习系列

    Kafka学习总结(一)——Kafka简介 Kafka学习总结(二)——Kafka设计原理 Kafka学习总结(三...

  • Kafka应用总结--重分配(reassign)

    之前写过一篇文章,介绍我使用kafka一段时间后的总结,Kafka应用总结[https://www.jianshu...

  • Zookeeper运维小结--CancelledKeyExcep

    项目中用到storm+kafka+zookeeper,在实际应用中zk和kafka常出问题,这里记录下在使用zk过...

  • Kafka学习

    MQ入门总结(六)Kafka的原理和使用 Kafka的架构原理,你真的理解吗? 真的,Kafka 入门一篇文章就够...

  • Kafka 跨集群同步方案

    该方案解决Kafka跨集群同步、创建Kafka集群镜像等相关问题,主要使用Kafka内置的MirrorMaker工...

  • gradle依赖版本错误

    问题复现 在项目中使用kafka组件,查看依赖(gradle dependencies)发现kafka-clien...

  • Kafka的知识点梳理

    Kafka的用途有哪些?使用场景如何? Kafka中的ISR、AR又代表什么?ISR的伸缩又指什么 Kafka中的...

网友评论

      本文标题:Kafka使用中的两个问题总结

      本文链接:https://www.haomeiwen.com/subject/nwjnottx.html