美文网首页
ODPS中令人困惑的"\N"

ODPS中令人困惑的"\N"

作者: suixinsuoyuwjm | 来源:发表于2014-10-27 11:49 被阅读0次

    在使用ODPS上的表时,很可能这个表中的数据是采用某些同步工具从其他的数据源中同步而来的,而当你想过滤某个字段field_name中值为null的数据时,往往会在where条件中按照 where field_name is not null来过滤field_name中的null值。

    但是当你按照如上方式过滤后,重新审视过滤后的数据你会发现其实情况并不像你想的一样:过滤后的filed_name字段中虽说不包括null值,但是会出现一些奇怪的\N,这时该怎么办呢?

    解决方案:一些同步工具在向ODPS中同步数据源(例如MySQL数据库)中的数据时,会将一些null字段给赋值为"\N",而这些字段在ODPS的表中很容易被认为是null而忽略,这将影响最终的数据质量;

    例如:若简单的在where条件中按照 where field_name is not null来过滤field_name中的null字段,可能最终的field_name字段中会包括"\N"的情况。

    因此,若希望在ODPS表中过滤某个字段中的null数据,可以按照以下方式:

    where (field_name is not null or field_name <>'\\N')

    过滤后field_name字段中就不会存在null或者\N的数据了!

相关文章

  • ODPS中令人困惑的"\N"

    在使用ODPS上的表时,很可能这个表中的数据是采用某些同步工具从其他的数据源中同步而来的,而当你想过滤某个字段...

  • 如何绕过ODPS不支持的笛卡尔积的限制

    odps不支持无 on 的 join 会报 *ODPS-0130252 Cartesian product is ...

  • ODPS基本概念

    什么是ODPS? 开发数据处理服务(Open Data Processing Service,简称ODPS),20...

  • ODPS

  • 如何使用ODPS?

    1.现在阿里云官方的客户端 2.将你的access_is和access_key配置到odps\conf\odps_...

  • ODPS SQL学习笔记一

    1、ODPS与Mysql的一个区别: 2、 3、ODPS SQL环境下日期类型的默认格式:yyyy-mm-dd h...

  • SQL编译转化为MapReduce的过程

    我们知道,目前Hive和ODPS在底层都将SQL编译转换为MapReduce任务执行,本文以ODPS为例,总结了一...

  • odps的使用

    odps是我们自主研发的一套数据处理服务。使用过hive的同学可以很快入门,语法与hive的sql基本一致。hiv...

  • ODPS JOIN

    阿里云中Max Compute(原ODPS)计算引擎学习备忘录。 子查询 子查询等价:https://help.a...

  • opdp权威指南-读书笔记

    1、odps 概述 1.1 介绍 odps(开放数据处理服务)是面向大数据处理的云计算服务主要提供结构化和半结构化...

网友评论

      本文标题:ODPS中令人困惑的"\N"

      本文链接:https://www.haomeiwen.com/subject/colvtttx.html