不存在词库中的字符编码
选取 ~ 和 ﹌ 两个字符(不在词表中),分别进行编码:
bc.encode(['~','﹌']) >array([[-0.07489464, 0.16149375, -0.33627284, ..., 0.04575281, > -0.28409064, -0.37837937], > [-0.5791109 , 0.6424987 , -0.44838306, ..., 0.15206014, > 0.2173949 , -0.34425637]], dtype=float32) ``` 可以看到得出的vector是不一样的
网友评论