美文网首页
记一次Dubbo枚举参数的问题排查

记一次Dubbo枚举参数的问题排查

作者: 换个名字_b5dd | 来源:发表于2022-03-09 15:02 被阅读0次

问题描述:

服务A依赖服务B的dubbo接口yyyMethod,其中传参XxxRequest中有个枚举类型APP,有时服务A调用yyyMethod后的代码会出现异常(非必现)。

@Data
public class XxxRequest implements Serializable {
        private APP app;
    .....
}
@Data
@Builder
public class XxxResponse implements Serializable {

    private String code;

    private String msg;

    private Map<String, Object> ext;

    private Boolean result;
}
@Override
public XxxResponse yyyMethod(XxxRequest request) {
    if (request == null) {
        return XxxResponse.builder().build();
    }
    boolean result = ....;
    return XxxResponse.builder()
                        .code("8000")
              .result(result)
              .build();
}

ServiceA中的调用代码:

Transaction transaction = Cat.newTransaction("aaaa", "bbb");
try{
        XxxRequest request = new XxxRequest();
    request.setApp(APP.xxx);
    ....
        response = serviceB.yyyMethod(request);
    if(response != null && !response.getResult()){
        ......
    }
}catch (Exception e) {
    transaction.setStatus(e);
    log.warn("xxxxx fail! errorMsg:{}", e.getMessage());
} finally {
    transaction.complete();
}

2. 排查过程及猜想

因为ServiceA中的代码调用中的log.warn日志中没有带出异常e的堆栈,所以给问题排查带来一定难度。从日志中看:xxxxx fail! errorMsg:null。也无法确定异常的类型,然后去Cat碰运气上找对应transaction的exception类型,发现是一个java.lang.NullPointerException。

transaction.setStatus(e)会将异常的类型带上,代码如下:

 public void setStatus(Throwable e) {
    this.status = e.getClass().getName();
    this.statusCode = -1;
 }

由上步骤能确定异常类型为NullPointerException,但是因为没有堆栈,所以暂时怀疑是XxxResponse中的result的大Boolean是个null,所以才出现的NPE。

于是去yyyMethod方法中去查找result可能返回空的逻辑,也就只能定位到request==null时,才会返回result=null的XxxResponse了,但是ServiceA中的代码调用中request是不为null的,所以有点困惑。苦想无果,暂时搁置。

第二天注意到了XxxRequest中的枚举值,之前也看过Dubbo文档中说过的枚举值的最佳实践。但是也没说调用方传入服务端不识别的枚举值时,会出现什么后果。显示去检查ServiceA和ServiceB中的APP所在包的版本,发现不一致,ServiceA的版本领先于ServiceB,所以存在枚举值不一致的情况。于是开始写Demo去实验:调用方传入服务端不识别的枚举值时的标签。

Demo验证及Dubbo源码debug分析:

demo验证:

  1. 本地将ServiceB中的APP对应jar包版本指定为低版本,启动是增加参数:dubbo.provider.version=ZJX 防止测试环境流量访问。

  2. demo测试方法:

参数app传一个ServiceB没有:

public class ServiceBTest extends BaseDubboServiceTest<ServiceB> {

    @Test
    @AssignEnv(value = Env.TEST, version="ZJX")
    public void testYyyMethod() {
        XxxRequest request = new XxxRequest();
        request.setApp(APP.xxxx);
        ....
        System.out.println(getService().yyyMethod(request));
    }
}
  1. 测试结果:

yyyMethod中拿到的request是一个null, 结果返回了一个result为null的XxxResponse实例。

Dubbo源码debug分析:

以下为dubbo 2.7代码为例,直接跳到解析参数的地方:org.apache.dubbo.rpc.protocol.dubbo.DecodeableRpcInvocation.decode(Channel channel, InputStream input)

....
 args = new Object[pts.length];
 for (int i = 0; i < args.length; i++) {
        try {
                args[i] = in.readObject(pts[i]);
        } catch (Exception e) {
                if (log.isWarnEnabled()) {
                        log.warn("Decode argument failed: " + e.getMessage(), e);
                }
        }
 }
 ....

org.apache.dubbo.common.serialize.Serialization上默认使用的是hessian2,也就是说请求的时候,序列化使用的是hessian2,那么反序列化也是用的hessian2。对应:org.apache.dubbo.common.serialize.hessian2.Hessian2Serialization

package org.apache.dubbo.common.serialize;

@SPI("hessian2")
public interface Serialization {
.....
}

大致链路:Hessian2Serialization->Hessian2ObjectInput->Hessian2Input->SerializerFactory.getDeserializer(Class).readObject(AbstractHessianInput)

SerializerFactory中对自定义Class使用的是默认的反序列化类:JavaDeserializer

protected Deserializer getDefaultDeserializer(Class cl) {
        return new JavaDeserializer(cl);
}

JavaDeserializer中大致分两步:

  1. 实例化对象
    @Override
    public Object readObject(AbstractHessianInput in, String[] fieldNames)
            throws IOException {
        try {
            Object obj = instantiate();

            return readObject(in, obj, fieldNames);
        } catch (IOException e) {
            throw e;
        } catch (RuntimeException e) {
            throw e;
        } catch (Exception e) {
            throw new IOExceptionWrapper(_type.getName() + ":" + e.getMessage(), e);
        }
    }
  1. 反序列化属性值并注入对象
public Object readObject(AbstractHessianInput in,
                             Object obj,
                             String[] fieldNames)
            throws IOException {
        try {
            int ref = in.addRef(obj);

            for (int i = 0; i < fieldNames.length; i++) {
                String name = fieldNames[i];

                FieldDeserializer deser = (FieldDeserializer) _fieldMap.get(name);

                if (deser != null)
                    deser.deserialize(in, obj);
                else
                    in.readObject();
            }

            Object resolve = resolve(obj);

            if (obj != resolve)
                in.setRef(ref, resolve);

            return resolve;
        } catch (IOException e) {
            throw e;
        } catch (Exception e) {
            throw new IOExceptionWrapper(obj.getClass().getName() + ":" + e, e);
        }
    }

枚举类型对应的反序列化类是:com.alibaba.com.caucho.hessian.io.EnumDeserializer. 大致逻辑是找到对应枚举类,调用其valueOf(Class, String) 方法去获取对应的枚举值。

/**
 * Deserializing an enum valued object
 */
public class EnumDeserializer extends AbstractDeserializer {
    private Class _enumType;
    private Method _valueOf;

    public EnumDeserializer(Class cl) {
        // hessian/33b[34], hessian/3bb[78]
        if (cl.isEnum())
            _enumType = cl;
        else if (cl.getSuperclass().isEnum())
            _enumType = cl.getSuperclass();
        else
            throw new RuntimeException("Class " + cl.getName() + " is not an enum");

        try {
            _valueOf = _enumType.getMethod("valueOf",
                    new Class[]{Class.class, String.class});
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

    @Override
    public Class getType() {
        return _enumType;
    }

    @Override
    public Object readMap(AbstractHessianInput in)
            throws IOException {
        String name = null;

        while (!in.isEnd()) {
            String key = in.readString();

            if (key.equals("name"))
                name = in.readString();
            else
                in.readObject();
        }

        in.readMapEnd();

        Object obj = create(name);

        in.addRef(obj);

        return obj;
    }

    @Override
    public Object readObject(AbstractHessianInput in, String[] fieldNames)
            throws IOException {
        String name = null;

        for (int i = 0; i < fieldNames.length; i++) {
            if ("name".equals(fieldNames[i]))
                name = in.readString();
            else
                in.readObject();
        }

        Object obj = create(name);

        in.addRef(obj);

        return obj;
    }

    private Object create(String name)
            throws IOException {
        if (name == null)
            throw new IOException(_enumType.getName() + " expects name.");

        try {
            return _valueOf.invoke(null, _enumType, name);
        } catch (Exception e) {
            throw new IOExceptionWrapper(e);
        }
    }
}

Enum.valueOf逻辑:

 public static <T extends Enum<T>> T valueOf(Class<T> enumType,
                                                String name) {
        T result = enumType.enumConstantDirectory().get(name);
        if (result != null)
            return result;
        if (name == null)
            throw new NullPointerException("Name is null");
        throw new IllegalArgumentException(
            "No enum constant " + enumType.getCanonicalName() + "." + name);
    }

所以当枚举值是我当前枚举不存在的值时,valueOf方法会抛异常IllegalArgumentException。EnumDeserializer中会抛出IOExceptionWrapper, 一直往上抛到DecodeableRpcInvocation.decode中对于参数处理的部分(下图):可以看出参数反序列化失败的异常被catch住后忽略了,造成的结果就是整个XxxRequest参数值为null了。

....
 args = new Object[pts.length];
 for (int i = 0; i < args.length; i++) {
        try {
                args[i] = in.readObject(pts[i]);
        } catch (Exception e) {
                if (log.isWarnEnabled()) {
                        log.warn("Decode argument failed: " + e.getMessage(), e);
                }
        }
 }
 ....

结论:

  1. 异常堆栈在日志中一定要带出来,不然无法定位到异常发生的具体行,就有点无头苍蝇的感觉。
  2. 参数为null的处理逻辑,要么就按失败处理,返回指定错误码;要么就不处理,等报NPE,也方便及时发现问题。
  3. 枚举的使用最佳实践参考官方:最佳实践。其中第二点说明了对于可变的枚举值,不建议使用枚举。在不识别的枚举值反序列化时,会出现异常,当该参数直接是方法的参数时,那么服务端获取到的该参数值为null;当枚举是自定义类中的属性,那么服务端获取到的该自定义类参数的值将会是null.

相关文章

网友评论

      本文标题:记一次Dubbo枚举参数的问题排查

      本文链接:https://www.haomeiwen.com/subject/nvmtdrtx.html