美文网首页
jupyter-notebook解决中文乱码

jupyter-notebook解决中文乱码

作者: 古寒飞 | 来源:发表于2021-07-02 14:41 被阅读0次

    进入jupyter-notebook的安装环境

    cd /opt/Jupyter-Notebook/notebook-6.4.0
    
    打开python虚拟环境(这里有autoenv自动打开,但是本质上依然要打开python的env环境)
    
    source /opt/Jupyter-Notebook/env/bin/activate
    

    检查有没有指定的包

    pip list|grep matplotlib
    
    如果有的话继续下一步
    

    打开ipython

    root@jupyter-notebook-1 notebook-6.4.0 # ipython
    Python 3.7.9 (default, Jun 20 2021, 18:28:19) 
    Type 'copyright', 'credits' or 'license' for more information
    IPython 7.24.1 -- An enhanced Interactive Python. Type '?' for help.
    
    In [1]: import matplotlib
    (1号位解释说明)
    Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 258 ('font.family:  sans-serif')
    Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 266 ('font.serif:      DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif')
    Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 411 ('axes.unicode_minus: False  # use Unicode for the minus symbol rather than hyphen.  See')
    
    In [2]: print(matplotlib.matplotlib_fname())
    (2号位解释说明)
    /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc
    
    In [3]:
    

    1号位说明:

    这是一个python的常规报错,因为我在下文中修改指定文件的时候,选择的是复制一行而不是直接在原文上修改。因此这里报错:Duplicate key in file PosixPath
    报错意思是:文件PosixPath中存在重复密钥

    2号位说明:

    这个位置就是matplotlib模块的安装位置,要记得env环境里的包安装位置与全局环境中的包安装位置是不同的,注意区分。

    我们找到上文中的这个包安装位置之后,就可以开始进行下一步的操作了:

    cd /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/
    ls 
    
    drwxr-xr-x 5 root root  4096 Jun 20 18:52 fonts
    drwxr-xr-x 2 root root  4096 Jun 20 18:52 images
    -rw-r--r-- 1 root root 41012 Jul  1 12:15 matplotlibrc
    drwxr-xr-x 2 root root  4096 Jun 20 18:52 plot_directive
    drwxr-xr-x 3 root root  4096 Jun 20 18:52 sample_data
    drwxr-xr-x 2 root root  4096 Jun 20 18:52 stylelib
    

    进入指定的目录并下载中文字体文件:

    cd /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/fonts/ttf/
    
    wget https://xxxxxxxxxxxxxxxxxxxx/bao/zabbix/simkai.ttf  (这个字体文件是以前处理zabbix上的图表中文化时用的中文字体文件,可以联系作者获取该字体)
    

    字体加载好之后,然后修改matplotlib模块的全局配置文件

    vim /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc
    
    第一处修改:
    找到 font.family ,然后去掉注释,不用做任何修改
    
    第二处修改:
    找到 font.sans-serif ,去掉注释之后,然后再他的值中添加simkai字体的名称。添加之后的内容如下:
    font.sans-serif: simkai, DejaVu Sans, Bitstream Vera Sans, Computer Modern Sans Serif, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
    (其中:simkai就是我们放在指定目录里的字体文件的名称)
    
    第三处修改:
    找到:axes.unicode_minus,去掉注释后,把他的值从True修改为False
    
    最后保存这个文件
    

    matplotlib模块的全局配置文件修改好之后,去查看:/usr/lib/systemd/system/jupyter_notebook.service 文件,这个文件中规定了该服务器的启动用户是谁,从下文中可以看到该服务的启动用户是root用户

    [Unit]
    Description=jupyter_notebook
    After=network.target
    
    
    [Service]
    Type=simple
    User=root
    Group=root
    LimitNOFILE=100000
    LimitNPROC=100000
    WorkingDirectory=/opt/demo/
    ExecStart=/opt/Jupyter-Notebook/env/bin/python3 /opt/Jupyter-Notebook/env/bin/jupyter notebook --allow-root --ip=0.0.0.0 --port=8888
    Restart=no
    
    
    [Install]
    WantedBy=multi-user.target
    

    上文中,找到启动用户之后,去启动用户的根目录下找到matplotlib模块的缓存目录,直接删除这个缓存目录

    cd /root/.cache/
    
    rm -rf ./matplotlib
    

    重启matplotlib的服务器

    systemctl restart jupyter_notebook.service
    systemctl status jupyter_notebook.service
    

    此时再次运行一下上文中【打开iptyhon这个步骤,引用一下matplotlib模块】然后就可以看到用户的缓存目录中,又出现了新的matplotlib的缓存文件。然后打开这个缓存文件
    (经过实际测试,重复上面的ipython这个步骤,好像不会生成缓存,只有必须在jupyter-notebook中调用这个函数才会生成缓存)

    vim /root/.cache/matplotlib/fontlist-v330.json
    
    搜索关键字:simkai,可以看到这个字体的所有被解析出来的属性:
        {
          "fname": "fonts/ttf/simkai.ttf",
          "name": "KaiTi",
          "style": "normal",
          "variant": "normal",
          "weight": 400,
          "stretch": "normal",
          "size": "scalable",
          "__class__": "FontEntry"
        },
    

    此时注意一下name这个属性,这就是后面python代码执行时,需要引用的字体名称。

    到此为止全局配置文件算是搞完了。

    测试内容如下:

    打开jupyter-notebook,粘贴输入以下代码:

    import matplotlib as plt
    import seaborn as sns
    import pandas as pd
    
    tongji = pd.read_csv('tongji.csv')
    sns.set_context({"figure.figsize": (16, 9)})
    sns.set_style({'font.sans-serif': 'KaiTi'})
    plt.rcParams['font.sans-serif'] = ['KaiTi']
    sns.barplot(data=tongji, x=douyin.category, y=douyin.fans)
    

    最后就会得到一张包含中文字体的图片,如下图所示:


    image.jpeg

    相关文章

      网友评论

          本文标题:jupyter-notebook解决中文乱码

          本文链接:https://www.haomeiwen.com/subject/oyweultx.html