训练

作者: 宴会说 | 来源:发表于2023-07-13 07:59 被阅读0次

    上周领导安排一个任务,尝试使用深度学习实现智能解译,要求极简单。尽快实现,领导要看到效果。

    我不敢耽误,马上安排一高材生开展技术尝试。我先摸排一下现有的装备,硬件装备如同老套筒汉阳造,摸排一遍,显存超过8Gb的计算机一台也没有。稍微好点的电脑只有内存稍微大点,也只有64Gb,一般人看起来很不错。其实拿来做生产,完全不够用。我不能继续当二传手,只管把话传下去。然后就等着要结果。显然这不是我这个基层技术人员的作风,只是做个传话筒,要我有什么用。

    我根据实际装备情况,制定试验目标。尊重现实,将实现技术路线,验证方法作为目标。我和高材生一起商量,采取降低数据质量、缩小试验范围、减少样本量、降低卷积层数等措施,进一步降低试验难度,确保试验目标达成。

    在一众同事质疑的眼神里,我和高材生两个,用两台笔记本电脑和一台台式机开始试验。需要说明的是,那台台式机也只有16Gb内存。

    部署好环境,本着先易后难的原则,先选择农田里的塑料大棚作为测试对象。塑料大棚纹理特征明显,与周边地物反差大,几何形状相对规则。两个人凭借多年人工绘图经验,不到半个小时,完成样本库制作。样本只有一百多个,与正式项目生产动辄十几万个的样本库相比,完全不够看。有什么枪打什么鸟,不能超越实际工作。

    样本库标准完成之后,导出为标准切片,进行模型训练,不敢选择卷积层数多的模型,只能来个最简单的像素分类模型,每个处理批次只敢设置为4,小心翼翼地设置完成后,点击运行。电脑风扇疯转,“呼呼呼”的声音,像是要起飞,把我和高材生都吓得想要马上关机,还好我胆子大,冒着烧掉CPU的风险,强行作业。

    风扇呼呼一个多小时以后,完成模型输出。依托模型进行对象分类,刚一运行,却弹出错误。高材生看了马上去问度娘,我用自己蹩脚的英文尝试看下什么原因,貌似在说编码问题。我想起前几年被python2折腾的死去活来的中文编码,马上想到可能是有中文,打开模型引导文件,果真有“大棚”两个汉字,我手动替换为“DP”,重新加载,分类正常进行,电脑风扇转得更快,呼呼声更大。我马上告诉高材生问题解决,不用再问度娘。

    大约两个小时以后,分类结果出来了,虽然有些许错误提取,个别漏提。但是提取出来的大棚轮廓清晰,边界准确。看起来这条路行的通。

    我和高材生都觉得效率有点低,继续发挥钉子精神,准备攻克GPU学习难关。看下手里的设备,只有我那台笔记本显存为6Gb,我真有点舍不得让它来出这么大力。这时我心爱的一台笔记本陪我两年多了,立下汗马功劳。我主要是怕它扛不住冒烟了。

    舍不得孩子套不到狼,我拍一脑壳,有困难也要上。一开始想简单了,在环境里面简单设置为GPU就开始跑,电脑毫不客气,秒出错。弹出一串英文。高材生对我讲,这是CUDA版本不一致,她在学校遇到过。

    于是一个人输命令查系统,一个人问度娘,好不容易找到对应的CUDA版本,安装好CUDNN,重新跑,没报错也没反应。输入指令一看,系统获取的GPU ID为空。

    两个人纳闷,继续问度娘,原来不需要输入任务管理器的ID,要输入nvidia-smi的ID。改正ID,重新运行,显卡风扇稍微有点疯转,没CPU风扇那么厉害,八分钟多一点跑完模型,速度提高真快。带着激动的心情,再一次进行分类操作,只需数秒,弹出绿色的成功信号。

    两个人感慨,GPU也太厉害了。点开结果数据集一看,却是空集。问度娘,反复看始终没有解决,正想要换个基础数据再测试,办公室一人过来说,要检查什么电脑。真的是很烦,只有收起电脑终止试验。

    这个问题成为后续需要解决的一个重大问题,把这个问题解决了,就能够超越试验目标,距离投入实际生产更近一步。期待,继续努力。

    相关文章

      网友评论

        本文标题:训练

        本文链接:https://www.haomeiwen.com/subject/uepqydtx.html