最近使用模型时候发现有很多参数在使用之后,它的计算结果的偏差是不一样的。
按道理说,应该先分析医用的数据,然后再试着选用不同的参数。但是我现在手头有1万多条实力,实在没有办法一个个的去试。
看了一个其他人的方案,就是做个循环,把所有参数当做个列表逐一输入到模型当中,通过计算将所有模型的偏差计算出来,取平差最小的计算结果。
平台最小的计算结果对应的参数就是计算机目前所有参数当中可用的最好参数。
这里只需要把参数做循环,剩下的就是靠算力逐一去尝试。
这个想法也可以扩展到更多的算法当中,通过尝试不同的算法,通过统计的偏差进行比较。
由于我现在手头有1万多条手机,跑一次估计要很久很久,但是中间我可能会反复的停止,所以需要是一个可以记录状态的批处理任务。
比方说这次从一考到第1000条就额外终止了,那么下一次就需要从1001条开始继续运行。
同时由于新数据的不断增加,需要基于新数据,不停的重新序列模型,并且重新找到最小的误差的参数。
网友评论