方法一:
一、参考链接:
二、基本步骤:
1.安装Arm版本的Anaconda,官网已经发布。
2.创建虚拟环境:
conda create -n env_tensorflow_acc python=3.8
3.激活虚拟环境:
4.从Apple github上下载已经编译好的tensorflow:
Apple tensorflow Github链接
在Release,下载完整包(包含h5py、tensorflow、tensorflow addons、grpcio),并解压。
5.安装:
依次运行下面的代码
# 运行以下代码
# -c conda-forge 指定更新的源(仓库)
# 更新pip、six等这几个包,提示没有的conda安装
conda upgrade -c conda-forge pip setuptools cached-property six
# 这里是从Apple Github下载的文件的路径(下同)
libs="/Users/.../Downloads/fromSafari/tensorflow_macos/arm64/"
# 将envname换成你自己新创建环境时起的名字(env_tensorflow_acc)
env="/Users/.../opt/anaconda3/envs/envname"
# 把<下载Arm64文件夹下的包grpcio>安装到<新环境/python3.8/site-packages下>
# 注意文件名要与下载的文件文件名相同
pip install --upgrade -t "$env/lib/python3.8/site-packages/" --no-dependencies --force "$libs/grpcio-1.33.2-cp38-cp38-macosx_11_0_arm64.whl"
# 安装h5py库
pip install --upgrade -t "$env/lib/python3.8/site-packages/" --no-dependencies --force "$libs/h5py-2.10.0-cp38-cp38-macosx_11_0_arm64.whl"
# 安装tensorflow addons库
pip install --upgrade -t "$env/lib/python3.8/site-packages/" --no-dependencies --force "$libs/tensorflow_addons_macos-0.1a3-cp38-cp38-macosx_11_0_arm64.whl"
# 依次安装以下库
conda install -c conda-forge -y absl-py
conda install -c conda-forge -y astunparse
conda install -c conda-forge -y gast
conda install -c conda-forge -y opt_einsum
conda install -c conda-forge -y termcolor
conda install -c conda-forge -y typing_extensions
conda install -c conda-forge -y wheel
conda install -c conda-forge -y typeguard
# 安装tensorboard
pip install tensorboard
# 依次安装以下库
pip install wrapt flatbuffers tensorflow_estimator google_pasta keras_preprocessing protobuf
# 安装tensorflow,注意文件名与下载的要相同
pip install --upgrade -t "$env/lib/python3.8/site-packages/" --no-dependencies --force "$libs/tensorflow_macos-0.1a3-cp38-cp38-macosx_11_0_arm64.whl"
流程
安装第一步更新时遇到没有的库就安装:
6.安装测试:
测试7.安装keras:
Snipaste_2022-09-03_11-00-18.png三、备注:
- Github上是Apple自己编译适配的Arm端(2021年左右的早期版本)库,包括tensorflow、grpcio、numpy、h5py,只是为了适配Arm M1系列芯片。
- 缺点就是:上面方法安装的tensorflow(Apple)相对较老(版本:2.4.0rc0),Apple Github上也已经归档;并且这么安装只是适配了M1 Arm芯片,并没有直接的GPU加速(CPU可用)。
方法二:
一、参考链接:
苹果开发者官网有比较详细的安装指南:Getting Started with tensorflow-metal PluggableDevice。
二、基本要求:
Requirement三、基本步骤:
1.安装Arm版本的Anaconda,创建并激活虚拟环境:
conda create -n env_tf_acc python=3.9
2.Install the TensorFlow dependencies:
conda install -c apple tensorflow-deps
3.Install base TensorFlow
python -m pip install tensorflow-macos
4.Install tensorflow-metal plugin
python -m pip install tensorflow-metal
四、备注:
- 这样安装的Tensorflow是最新的版本(版本:2.9.2),支持Metal GPU加速。
- 也会自动安装相关的库,比如grpcio、numpy、h5py、six……(包括Keras、keras-preprocessing)
-
注意:默认安装的numpy、numpy-base版本过低(1.21.5),运行时会报错如下:
Error
Error
解决办法是更新numpy即可:
pip install numpy --upgrade
- 安装scipy
keras中某些类(如keras.preprocessing.image.ImageDataGenerator)或者其他深度学习需要用到scipy库,注意不要使用conda安装!conda默认安装的版本是1.7.3,会一起安装numpy-base1.21.5,这与上面的numpy更新产生了冲突。
即便是指定了安装版本,在channel中也搜索不到。
image.png
解决办法是使用pip安装
pip install scipy
- 安装matplotlib
默认安装3.6.0,使用时会报错。
AttributeError: module 'backend_interagg' has no attribute 'FigureCanvas'
解决办法是先卸载,然后安装指定版本:
pip uninstall matplotlib
pip install matplotlib==3.5.2
- 以上pip安装会出现timeout的错误,再次尝试即可。
上述两种方法测试:
用类似MNIST数据集的简单模型跑一下:
方法一:
默认使用CPU跑:
大概<单个Epoch><每个batch>350-390us左右
截屏2022-09-09 09.45.22.png
CPU占用13.6%(系统bug显示错误)
截屏2022-09-09 09.46.28.png
方法二:
默认使用GPU跑:
Metal
大概<单个Epoch><每个batch> 5ms左右
截屏2022-09-09 09.51.20.png
CPU占用11.9%(系统bug显示错误),GPU占用率91.9%
截屏2022-09-08 22.30.19.png
有以上两个方法测试可知:
- 模型较小的原因,导致GPU跑比CPU慢了不少(每个batch-5000us v.s. 370us)。
- 网络结构比较小的时候,效率瓶颈在CPU与GPU数据传输,这个时候只用cpu会更快。网络结构比较庞大的时候,gpu的提速就比较明显了。
整个耗时要从整体角度考虑,而不是仅仅考虑模型训练,想想你的数据处理 (CPU)、数据装载(CPU)、模型训练 (CPU/GPU),如果你本身模型很小就完全没必要用GPU了(这种情况或许只发生在你提到的minist这种toy network中),因为把数据从CPU运到GPU花费的时间比你GPU跑模型时间更长。换言之,如果发现模型速度上存在瓶颈,你也先应该去分析数据处理、数据装载、数据传输、模型训练到底哪个环节时间耗时是主要矛盾,然后再去解决。
网友评论