在学python,调试linux,尝试搭res-net环境,但是发现上周读的论文懂的思路又忘了,跟不上了。今天要重新开始,又不知道做什么了。
1.继续搭好res-net框架。
2.然后要再看细一点它的改进,想一想怎么应用改进去
3.测试
4.读数学推导,整理手推
5.下一部分是稳定性的部分,再细致读懂+实验
6.数学推导,手推。
7.想一点new thing。结合所有论文,再重读重读。
8.整理结果,整理参考文献,整理思路,提高写作素养和水平。
新的问题:
imagenet数据集太大了,100多G,就很麻烦。 下载完了,训练到差不多也不知道多长时间。
利用云服务去训练,还得再学,而且花钱。
现在仔细看了论文,发现论文里用的是cifar10/100去复现,而且主要是pre-act 也说明我之前的搜索和苦恼,反正对于真正工作的推进和落实,作用是不大的。
我都纠结和准备了啥呢?
1.调研了FAIR 基于torch的resnet复现,发现描述有许多GPU的要求,但是我没有许多GPU,我怕不能部署,同时怕,if下下来,CPU干不了,不兼容,要改很多东西,所以放弃这个选择,但是同时也去搜索了云GPU的方法,发现了一篇总结还不错,以后用得到,但是没有进一步细看。
2.熟悉anaconda linux下的使用 环境创建 激活,安装tensorflow
3.下了个tensorpack 也是想复现来着
4.找imagenet 观察imagenet的描述信息, 账号注册,又发现实在是 数据集太大了
5.现在同时在下已有的模型,很多convert,发现了起码两类convert 吧,想用fine-tune微调 加东西,去改。 或者先跑起来识别测试。
6.下载模型也可以下两个渠道,一个是一种转好的,一个是原有的 -convert,两个渠道的源码不太一样。然而。。。我是想结合。。。。。也不知道行不行
7.现在要转化cifar的准备了:再研究研究数据集,还有哪个版本哪的代码(原本tensorflow,tensorpack 大致就这么多吧)
网友评论