美文网首页
kafka开发中遇到的问题集

kafka开发中遇到的问题集

作者: 点点渔火 | 来源:发表于2017-09-26 13:27 被阅读0次
    • 错误: Spark prints an avalanche of warning messages from Parquet when reading parquet files written by older versions of Parquet-mr
      原因: spark2.10存在的bug
      参考: https://issues.apache.org/jira/browse/SPARK-17993

    • --conf spark.streaming.kafka.maxRatePerPartition=1000
      设置每个batch最多处理条数, 超过的话分为几个batch处理

    • 写kafka时会socket连接有时会出现断开, 这时需要设置retries = 3 或者 5, 甚至在foreachPartition中加一个try, catch尝试重新建立连接(close掉上一个连接)

    相关文章

      网友评论

          本文标题:kafka开发中遇到的问题集

          本文链接:https://www.haomeiwen.com/subject/wfesextx.html