上文 : 将“万词王”离线转化为“文络之心“插件之一:复现 wantwords Python/Pytorch 开源项目
首先,上手试试清华大学的中文分词库,thulac图拉克。除了python竟然还有java版本、c++版本。
import thulac
thu1 = thulac.thulac() # 首次加载
thu1.cut("我是中国人", text=True)
分割为:'我_r 是_v 中国_ns 人_n',比icu的分词库更细,不过icu还同时支持日文韩文的简单分词,不知是怎么做到的。
thu1.cut("私は日本語ができません。", text=True)
'私は_n 日本_ns 語ができません_id 。_w'
SciPy 赛派
反向词典并未直接调用SciPy。
照着网络教程“Scipy入门 - 码农教程”,学习票房走势画图。未能运行其中代码。python不愧是宇宙第一塑料积木语言,上手必报错。其中的scipy调用有:
import numpy
a = numpy.arange(9).reshape(3,3)
io.savemat("a.mat",{'array':a})
>>> import scipy
>>> scipy.signal.detrend([1,2,3,7,8,9])
array([ 0.42857143, -0.34285714, -1.11428571, 1.11428571, 0.34285714,
-0.42857143])
“Scipy入门 - 码农教程”报错,但是可以用这篇文章里的数据,手动输入数据测试detrend方法:detrend学习 - statology
测试代码为:
原始数据 = [8,13,18,24,20,18,24,27,22,20,28,32,29,28,30,37,34]
X_axis = numpy.arange(len(原始数据))
#plt.xticks(X_axis, X_axis*2)
plt.plot(X_axis,原始数据,label='原始数据')
detrend = scipy.signal.detrend(原始数据)
plt.plot(X_axis,detrend,label='去趋势波动图')
trend = 原始数据 - scipy.signal.detrend(原始数据)
plt.plot(X_axis,trend,label='潜在趋势图')
plt.title("数据走势图")
plt.xlabel('x-ticks')
plt.ylabel('value')
plt.legend()
plt.show()
如果子系统下 matplotlib.pyplot 没反应
,需要安装 VcXsrv (VC++ Windows X Server)图像接口, python3-tk等
export DISPLAY=:0.0
export LIBGL_ALWAYS_INDIRECT=1
matplotlib 入门:
import matplotlib.pyplot as plt
import numpy as np
fig=plt.figure(num=1,figsize=(4,4))
plt.plot([1,2,3,4],[1,2,3,4])
plt.show()
如果画图程序无法显示中文, 需要手动安装SimHei.ttf (可从c/windows/fonts复制到\\wsl$\Ubuntu\home\u\.local\lib\python3.10\site-packages\matplotlib\mpl-data\fonts\ttf
),此外,还需要重置matplotlib的字体缓存:
import matplotlib.font_manager
matplotlib.font_manager._load_fontmanager(try_read_cache=False)
于是乎有scipy.detrend的入门之图画:
趋势图
未完待续……
网友评论