spark与hive查询得出的数据不同

spark与hive查询得出的数据不同

作者: 有机会一起种地OT | 来源:发表于2020-10-29 09:36 被阅读0次

spark与hive查询得出的数据不同
spark sql use hive
Spark实例-操作Hive数据
Spark-1.6.1 SQL与Apache Hive SQL的
解决HUE使用sparksql查询无法显示元数据的问题
spark sql快速入门
解决NameNode配置HA后Hive路径不正确的问题
Hive自动map join优化而引发MapJoinMemory
【Spark】Expected only partition p
Spark读取Hive时schema版本不匹配的解决方法

在实际工作的情况中，经常有spark与hive查询出来的数据存在不一样的情况，基本的原因如下：
1、由于精度不一样导致的
2、更多的时候确实是由于元数据混乱导致的
（就是说hive中能读到这个字段的值，但是在spark中却无法读取到该字段的值。
很多时候可能还是由于大小写的混乱所导致的）

同一条sql,hive能生成表,而spark却生成的一张空表,或者数据缺少,存在null值,与hive结果不一致
设置
spark.sql.hive.convertMetastoreOrc=false
convertMetastoreParquet=false

原因:
spark用自己的格式读取hive文件后进行自动转换后进行操作

官方说明

spark.sql.hive.convertMetastoreParquet ：
When reading from and writing to Hive metastore Parquet tables, Spark SQL will try to use its own Parquet support instead of Hive SerDe for better performance. This behavior is controlled by the spark.sql.hive.convertMetastoreParquet configuration, and is turned on by default.

spark.sql.hive.convertMetastoreOrc:
enables new ORC format to read/write Hive Tables.

相关文章

spark与hive查询得出的数据不同
在实际工作的情况中，经常有spark与hive查询出来的数据存在不一样的情况，基本的原因如下：1、由于精度不一样导...
spark sql use hive
spark sql 通过Spark SQL 查询hive中的数据要求提供操作截图切换数据库，选择指定的表；操...
Spark实例-操作Hive数据
Spark操作Hive数据库，实现数据表创建，数据加载，以及数据查询。实例代码如下：
Spark-1.6.1 SQL与Apache Hive SQL的
与Apache Hive的兼容性# Spark SQL 被设计成与Hive Metastore(元数据), Ser...
解决HUE使用sparksql查询无法显示元数据的问题
要解决的问题解决方法：1、首先你的hive肯定要能用，我们就是将spark的元数据查询请求转换为hive的元数据...
spark sql快速入门
常用的sql查询引擎 hive，impala，hive on spark，presto（京东），drill（支持h...
解决NameNode配置HA后Hive路径不正确的问题
配置了NameNode的HA后，Hive无正常查询数据了，但是其他的组件HDFS , HBase ,Spark都正...
Hive自动map join优化而引发MapJoinMemory
问题描述在Hive on Spark上运行一个hive查询脚本，spark将其划分为3个stage。发现脚本在执...
【Spark】Expected only partition p
在Hive向Spark迁移时，我们可能直接将HSQL语句直接运行在Spark-SQL上，如果查询时针对的是Hive...
Spark读取Hive时schema版本不匹配的解决方法
当使用Spark进行Hive数据操作时，提示如下：即Spark中采用的Hive metastore版本和 Hi...

网友评论

本文标题：spark与hive查询得出的数据不同

本文链接：https://www.haomeiwen.com/subject/kbqkvktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|spark与hive查询得出的数据不同|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！