使用presto数据库在字符数字比较中遇到的坑

作者: 9c0ddf06559c | 来源:发表于2018-05-15 10:52 被阅读23次

使用presto数据库在字符数字比较中遇到的坑
SpringBoot学习随笔记录1(数据库构建、开发环境)
Elasticsearch中一个空字符串引起的思考
Presto源码分析之数据类型
在NSLog和stringWithFormat:中使用NSNum
记录下NSCharacterSet实现字符过滤
Java自学-数字与字符串字符串转换
Java中的equals、数据库表名
Java 字符串_1
全栈小知识-mysql将字符串转换成数字

1.事情的始末

公司的sql查询平台提供了HIVE和Presto两种查询引擎来查询hive中的数据，由于presto的速度较快，一般能用presto跑就不用hive跑（有的时候如果使用了hive的UDF就必须用hive了），然而昨天发生了一件血案。

有一个需求需要统计某个时间小于100000s的所有记录，这个时间存在一个map<string,string>中，然后自然想到的就是where map["stat_time"] <100000 ，结果出来的数据特别少，开始还天真的以为是数据的确就特别少。后来产品说不正常。仔细排查以后发现，这些数据都是小于10的。

相信看到这里就已经比较清晰了，这presto种字符串和数字比较，是把数字转化成字符串进行比较，也就是"10000" 和 23比，"10000" 小，由于hive和很多语言以及框架上，这种情况都是把字符串转化成数字，就没做特殊处理。结果遇到了这个坑。后来把查询引擎缓存hive就好了。

2.扩展

不过为了安全，健壮性和可读性考虑，还是应该加上一些转换函数，hive和presto中都提供了cast转换

cast(value AS type) → type
显式转换一个值的类型。 可以将varchar类型的值转为数字类型，反过来转换也可以。

try_cast(value AS type) → type
与cast类似，不过，如果转换失败会返回null，这个只有presto有

另外需要注意的是
hive中的int类型是就是int，而presto中是包装类型Integer，如果cast的type写错也会报错

网友评论

本文标题：使用presto数据库在字符数字比较中遇到的坑

本文链接：https://www.haomeiwen.com/subject/xgredftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

使用presto数据库在字符数字比较中遇到的坑

1.事情的始末

2.扩展

相关文章