在之前的文章中分享如何在DataX中定义kuduWriter组件,在最近的工作中发现从oracle读取blob类型的数据到kudu时,数据不是期望的结果,接下来就让我们一起来看看如何处理该问题.
首先看一下错误的结果,这是未做调整时写入的kudu值.
错误的kudu数据
从这个引用地址可以发现该值是一个Byte数组,由此想到可以在组件中将值进行类型转换,输出为base64编码(业务需要,可根据自身业务自定义转换)
image.png
再进行一次数据的同步
图片2.png
最后得到的结果为base64转换后的数据,解决了自定义的kuduwriter无法写入blob类型的字段的问题
网友评论