由于工作中需要对mysql数据做同步,最终选用阿里的datax。在同步过程中需要对某些列做定制处理。
-
通用转换
针对通用的转换,如加密等很多表同步都使用到的,可以加入插件。可以参考com.alibaba.datax.core.transport.transformer下面的插件,自己加入插件。继承Transformer类。
2.非通用转换
对于某些列特殊的转换,比如一个json格式的字段,转为多个字段。可以使用dx_groovy插件,写groove代码实现。
"transformer": [{
"name": "dx_groovy",
"parameter": {
"code": "Column column = record.getColumn(2);
String oriValue = column.asString();
def jsonSlurper = new JsonSlurper();
def object = jsonSlurper.parseText(oriValue);
boolean isWatched = object.isMatched;
long paidNum = 0;
long noPaidNum = 0;
def list = object.details;
list.each {
boolean settlement = it.settlement;
if(settlement){
paidNum++;
}else{
noPaidNum++;
}
};
record.setColumn(2, new BoolColumn(isWatched));
record.setColumn(3, new LongColumn(paidNum));
record.setColumn(4, new LongColumn(noPaidNum));
return record;",
"extraPackage": ["import groovy.json.JsonSlurper;"]
}
}]
网友评论