本文摘自Linux中国《在 Fedora 上搭建 Jupyter 和数据科学环境》一文,对搭建步骤进行抽取整理。
笔者环境:Fedora 30 xfce,64位,python3
以下步骤:
- 安装Jupyter核心软件包:
sudo dnf install python3-notebook mathjax sscg
- 安装数据科学中常用模块:
sudo dnf install python3-seaborn python3-lxml python3-basemap python3-scikit-image python3-scikit-learn python3-sympy python3-dask+dataframe python3-nltk
- 设置一个用来登录Notebook的web界面的密码,从而避免冗长的令牌:
mkdir -p $HOME/.jupyter
jupyter notebook password
-
执行上述步骤后输入密码,会自动创建
$HOME/.jupyter/jupyter_notebook_config.json这个文件,其中包含了密码和加密后的版本。 -
使用SSLby为Jupyter的web服务器生成一个自签名的HTTPS证书
cd $HOME/.jupyter; sscg
- 编辑$HOME/.jupyter/jupyter_notebook_config.json 这个文件,下面是模板
{
"NotebookApp": {
"password": "sha1:abf58...87b",
"ip": "*",
"allow_origin": "*",
"allow_remote_access": true,
"open_browser": false,
"websocket_compression_options": {},
"certfile": "/home/heruo/.jupyter/service.pem",
"keyfile": "/home/heruo/.jupyter/service-key.pem",
"notebook_dir": "/home/heruo/Notebooks"
}
}
其中password是创建jupter_notebook_config.json时自行生成的,目录路径需改为自己的家目录。
- 创建一个用来存放Notebook的文件夹,应该和上面的notebook_dir一样
mkdir $HOME/Notebooks
- 完成配置,在任意地方输入jupyter notebook即可启动,或者在.bashrc中创建jn快捷命令:
alias jn='jupyter notebook'
-
运行 jn 命令后,在浏览器中地址栏输入<https://your-fedora-host.com:8888>,域名替换为本地IP地址即可。
-
数据科学常用工具:
- numpy
- pandas
- matploitlib
- Seaborn,基于matploitlib,绘图功能经过优化
- StateModels,为统计学和经济计量学的数据分析提供算法支持
- Scikit-learn,机器学习生态环境的重核心部件
- XGBoost,比较先进的回归器和分类器
- Imbalanced Learn,用于解决数据欠采样和过采样问题
- NTLK,用于处理人类语言数据的工具
- SHAP,用于分析机器学习做出的预测
- Keras,深度学习和神经网络模型的库
- Tensorflow,神经网络模型搭建工具
网友评论