是的,学术夫妻又来更新了,昨晚上老公突然看到了消息,说是北京大学开源了一个新的分词工具,让我下来学学,试着用一下。
于是今天我稍微得空就安装试用了。
很人性化,安装方法简单,就是
pip install pkuseg
就可以了
使用方法也很人性化,和其他大部分的分词器使用方法差不多。
上图是一个简单的例子代码。
官方的正确率是这样的
image.png
正确率就不容我置喙了,但是有一点,我要强调一下。
我的电脑里安装了七八种分词方法,这个分词真的速度特别慢,因为我的测试数据就只有一句话而已,但是他的速度已经慢到,我一度认为我的pycharm是不是出问题了。
网友评论