美文网首页
安装设置

安装设置

作者: 一言简之 | 来源:发表于2017-09-05 15:12 被阅读0次

    ZooKeeper基本配置

    • 以单机方式(STANDALONE SERVER)启动zookeeper:

    最简单的ZooKeeper配置

    # cat > /usr/local/zookeeper/conf/zoo.cfg << EOF
    > tickTime=2000                             //刷新时钟 
    > dataDir=/var/lib/zookeeper                //数据存放位置
    > clientPort=2181                           //客户端连接端口
    > EOF
    

    �启动命令

    # /usr/local/zookeeper/bin/zkServer.sh start
    
    JMX enabled by default
    Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
    Starting zookeeper ... STARTED
    
    • 以集群方式启动zookeeper:

    tickTime=2000
    dataDir=/var/lib/zookeeper
    clientPort=2181
    initLimit=20
    syncLimit=5
    server.1=zoo1.example.com:2888:3888
    server.2=zoo2.example.com:2888:3888
    server.3=zoo3.example.com:2888:3888
    

    服务器的配置说明:
    server.X=hostname:peerPort:leaderPort
    X:必须为从1开始的整数
    peerPort: 服务器之间相互通讯的端口
    leaderPort: 主节点使用的通讯端口
    initLimit:允许子节点与主节相连的次数
    syncLimit:允许异步子节点成为主节点的次数
    tickTime:每次连接的时间

    ZooKeeper集群(剧团)建议使用单数的服务器,例如,3,5. 如果使用3个服务器,可以在丢失一个服务器的情况下继续正常工作。如果使用5个服务器,那么可以在丢失两个服务器时正常工作。

    如何选择服务器的数量
    考虑运行服务器数量在5个服务器为佳。如果需要修改ZooKeeper的配置,那么需要替换停止节点,修改以后,需要重新加载节点。如果如果服务器不能容错一个以上的节点down掉,那么维护工作将会有额外的风险。同时,也建议不要使用7个以上的节点,大多数使用反馈看,7个以上节点,会面临这效率降低的问题。


    安装配置Kafka

    • 基本配置

    #zookeeper 地址,如果多个地址,以逗号隔开
    zookeeper.connect=9.51.103.134:2181,9.51.103.135:2181
    
    # Timeout in ms for connecting to zookeeper
    zookeeper.connection.timeout.ms=6000
    

    启动kafka server
    ./bin/kafka-server-start.sh -daemon ../config/server.properties

    为验证kafka是否启动成功,创建一个topic,并且生产消费一些消息

    • 创建并显示topic

    //创建topic
    # ./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
    Created topic "test".
    
    //显示topic
    # ./bin/kafka-topics.sh --zookeeper localhost:2181 --describe --topic test
    Topic:test    PartitionCount:1    ReplicationFactor:1    Configs:
        Topic: test    Partition: 0    Leader: 0    Replicas: 0    Isr: 0
    
    
    • 产生并消费消息

    //产生消息
    # ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
    Test Message 1
    Test Message 2
    ^C
    #
    //消费消息
    # /bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning
    Test Message 1
    Test Message 2
    ^C
    Consumed 2 messages
    #
    

    Broker 配置

    • broker.id
      默认值为0,每个broker的唯一整型识别码,仅仅用作于broker之间的区别,建议值包含本身意义,以便与识别,例如ip地址最后一组。
    • port
      默认9092, 监听端口,如果端口值小于1024,必须以root启动broker。不建议以root启动。
    • listeners
      PLAINTEXT://your.host.name:9092*
    • zookeeper.connect
      格式:hostname:port/path,如果需要连接多个,每组以分号隔开。 例如:localhost:2181, 其中path是可选项。 path是制定的kafka根目录,如果指定了,但是不存在,将在broker启东时自动创建。

    为什么要使用改变根目录
    一般情况下,考虑使用改变根目录,它可允许Zookeeper 剧团共享应用,包括kafka集群。在多个Zookeeper是,这也是最好的方式来指定server。指定后,如果ensemble出现问题,允许broker 连接到其他zookeeper下面的剧团。

    • log.dirs
      消息存放地址,多个以逗号分开
    • num.partitions
      没每个topic创建的分区数量

    如何确定分区的数量
    考虑分区数量,应该考虑一下一些因素:

    • 期望的吞吐量,比如 每分钟100KB 或者 1GB 每秒
    • 期望单个分区达到的吞吐量,大多数,单个消费者是从一个分区读取数据,如果知道消费者写入数据库的数据最大为50MB每秒,类似于这种,但给分区的最大吞吐量为60MB
    • 考虑每个生产者的最大吞吐量,一般情况下,生产者的速度总是大于消费者的
    • 如果发送消息是基于Keys的,那么在后期增加分区是比较麻烦的,所以设计分区要考虑以后的使用场景。
    • 考虑磁盘和网络情况
    • 要避免高估,每个分区使用资源会降低主分区的性能
    • log.retention.ms
      默认为log.retention.hours=168, 消息保存的时间,如果多个多个broker配置,那么最小值启用。
    • log.retention.bytes
      消息保存的容量,每个分区单独使用容量,单位为字节。如1GB,一共8个分区,那么总容量为8GB

    相关文章

      网友评论

          本文标题:安装设置

          本文链接:https://www.haomeiwen.com/subject/zjvyjxtx.html