美文网首页
反向词典的开源模块学习记录

反向词典的开源模块学习记录

作者: 天下第九九八十一 | 来源:发表于2022-12-05 14:25 被阅读0次

上文 : 将“万词王”离线转化为“文络之心“插件之一:复现 wantwords Python/Pytorch 开源项目

首先,上手试试清华大学的中文分词库,thulac图拉克。除了python竟然还有java版本、c++版本。

import thulac   
thu1 = thulac.thulac()  # 首次加载
thu1.cut("我是中国人", text=True)

分割为:'我_r 是_v 中国_ns 人_n',比icu的分词库更细,不过icu还同时支持日文韩文的简单分词,不知是怎么做到的。

thu1.cut("私は日本語ができません。", text=True)
'私は_n 日本_ns 語ができません_id 。_w'

SciPy 赛派
反向词典并未直接调用SciPy。

照着网络教程“Scipy入门 - 码农教程”,学习票房走势画图。未能运行其中代码。python不愧是宇宙第一塑料积木语言,上手必报错。其中的scipy调用有:

import numpy
a = numpy.arange(9).reshape(3,3)
io.savemat("a.mat",{'array':a})
>>> import scipy
>>> scipy.signal.detrend([1,2,3,7,8,9])
array([ 0.42857143, -0.34285714, -1.11428571,  1.11428571,  0.34285714,
       -0.42857143])

“Scipy入门 - 码农教程”报错,但是可以用这篇文章里的数据,手动输入数据测试detrend方法:detrend学习 - statology

测试代码为:

原始数据 = [8,13,18,24,20,18,24,27,22,20,28,32,29,28,30,37,34]

X_axis = numpy.arange(len(原始数据))

#plt.xticks(X_axis, X_axis*2)
    
plt.plot(X_axis,原始数据,label='原始数据')
detrend = scipy.signal.detrend(原始数据)
plt.plot(X_axis,detrend,label='去趋势波动图')
trend = 原始数据 - scipy.signal.detrend(原始数据)
plt.plot(X_axis,trend,label='潜在趋势图')

plt.title("数据走势图")
plt.xlabel('x-ticks')
plt.ylabel('value')

plt.legend()
plt.show()

如果子系统下 matplotlib.pyplot 没反应
,需要安装 VcXsrv (VC++ Windows X Server)图像接口, python3-tk等

export DISPLAY=:0.0
export LIBGL_ALWAYS_INDIRECT=1

matplotlib 入门:

import matplotlib.pyplot as plt
import numpy as np
fig=plt.figure(num=1,figsize=(4,4))
plt.plot([1,2,3,4],[1,2,3,4])
plt.show()

如果画图程序无法显示中文, 需要手动安装SimHei.ttf (可从c/windows/fonts复制到\\wsl$\Ubuntu\home\u\.local\lib\python3.10\site-packages\matplotlib\mpl-data\fonts\ttf),此外,还需要重置matplotlib的字体缓存

import matplotlib.font_manager
matplotlib.font_manager._load_fontmanager(try_read_cache=False)

于是乎有scipy.detrend的入门之图画:


趋势图

未完待续……

相关文章

  • 反向词典的开源模块学习记录

    上文 : 将“万词王”离线转化为“文络之心“插件之一:复现 wantwords Python/Pytorch 开源...

  • “反向词典”

    不知道你有没有过那种感受,就是你话到嘴边,却找不到形容词来表达,除了说点网络用语,感觉那一刻就是脑子空空如也。语言...

  • 英语学习

    词典 参考:市面上的英语词典那么多,选择哪一本最适合自己 开源词典:欧路词典、MDict、灵格斯词典、深蓝词典、G...

  • nginx实现tcp反向代理

    tcp反向代理默认不在nginx的模块里,想要nginx实现反向代理tcp请求,需要自己编译tcp模块到nginx...

  • 初衷

    1、记录一些开源界的故事,了解开源文化。 2、记录学习开源代码的过程。 3、熟悉Markdown语法。

  • scikit-learn 开源机器学习工具scikit-lea

    开源机器学习工具scikit-learn入门 Scikit-Learn是基于python的机器学习模块,基于BSD...

  • ERP订单管理的操作与设计--开源软件诞生19

    赤龙ERP订单模块讲解--第19篇 用日志记录“开源软件”的诞生 【点亮星标】----祈盼着一个鼓励博主开源地址:...

  • Scikit-Learn:开源的机器学习Python模块

    Scikit-Learn:开源的机器学习Python模块 scikit-learn是一个用于机器学习的 Pytho...

  • StarDict,Linux 下一款不错的开源小词典

    在 Windows 中,我们都习惯使用金山或有道的词典工具,但在 Linux 下,有没有还不错的开源词典软件呢?(...

  • Goldendict

    从Windows过来发现不能用有道词典了很尴尬,找了个Ubuntu上比较好用的开源词典Goldendict,支持取...

网友评论

      本文标题:反向词典的开源模块学习记录

      本文链接:https://www.haomeiwen.com/subject/elrvfdtx.html