美文网首页
Spark Mongo 笔记

Spark Mongo 笔记

作者: shaun_x | 来源:发表于2018-09-27 17:21 被阅读0次

spark mongo pipeline partitioning failed

ClassNotFoundException: ...MongoDefaultPartition

Partitioning using the 'DefaultMongoPartitioner$' failed.
java.lang.NoSuchMethodError: com.mongodb.client.MongoCollection.countDocuments(Lorg/bson/conversions/Bson;)

目前将partitioner设置为MongoSplitVectorPartitioner可解决

SparkConf().set("spark.mongodb.input.partitioner", "MongoSplitVectorPartitioner")

参考
https://docs.mongodb.com/spark-connector/current/configuration/index.html#input-configuration

no permission on database config

new SparkConf().set("spark.mongodb.input.uri", "mongodb://user:pwd@host:port/db.collection")

需要同时设置mongodb user的 config db read 权限

db.updateUser("readonly",{"roles":[{"role":"read","db":"yourdb"},{"role":"read","db":"config"}]});

相关文章

  • Spark Mongo 笔记

    spark mongo pipeline partitioning failed ClassNotFoundExc...

  • mongo spark加载数据不全的bug fix

    最近开始做大数据,数据库mongodb,计算用的spark,加载数据用的mongo-spark connector...

  • Mongo联合Spark

    1.SparkRDD方式 package cn.edu360.day2 import com.mongodb.sp...

  • mongo笔记

    1:基本操作 use admin db.createUser({user:"lxc",pwd:"123456",r...

  • Spark 2.3.1测试笔记二:SortExec性能测试1

    前言 本例基于1 Spark 2.3.0测试笔记一:Shuffle到胃疼 2 Spark 2.3.0测试笔记二:还...

  • spark

    *Spark Spark 函数Spark (Python版) 零基础学习笔记(一)—— 快速入门 1.map与fl...

  • spark 学习笔记

    Spark学习笔记 Data Source->Kafka->Spark Streaming->Parquet->S...

  • SKIL/配置/Spark解释器

    Spark解释器 可以配置笔记本和Zeppelin Spark 解释器,以使用Spark来获得更多的处理能力。如果...

  • Spark Core 学习笔记

    Spark Core 学习笔记 1、Spark 简介 ​ Spark 是一种用于大规模数据处理的统一计算引擎...

  • spark核心编程

    Spark 学习笔记 Spark 架构及组件 client:客户端进程,负责提交job到master Driver...

网友评论

      本文标题:Spark Mongo 笔记

      本文链接:https://www.haomeiwen.com/subject/ldtyoftx.html