美文网首页机器学习-算法理论
工业界做机器学习优化的方向

工业界做机器学习优化的方向

作者: shudaxu | 来源:发表于2019-07-13 10:58 被阅读0次

做策略算法的核心思路方向,以及其方法论:

1、对业务场景有深刻的认知,其中一个重要的议题是,在什么样的场景下,对什么样的目标来建模。
像普通的一些思路,在计算广告、推荐算法、电商等领域。大规模运用到排序,召回阶段的很多建模思路:比如一些隐式向量召回的建模,ctr预估的建模,时长,roi回报率的建模等等都已是直觉上就能想到的思路,并且就算在较小的系统规模下也会得到运用。而在一个更加复杂以及精细化的系统中,其中很多子项都可能有建模空间,比如之前提到的兴趣点预估,用户预估,相关性预估,重复预估模型,比如广告领域,动态生成广告词的文本生成模型,词包拓展的语言模型等可能跟业务场景,商业模式都有比较紧密的联系。但这其中也并不是所有模型都能有效提升,这跟选择的训练样本的量级(人工标注规模有限,场景特性也可能导致规模受限),样本处理方式(如何过滤噪音数据,如何从数据中获得label,如何人工生成样本等),能用的特征,模型目标设计等可能都有影响。
从方法论的角度来讲,要从建模的必要性,可能性,以及建模后潜在提升空间的大小来评估。

2、特征设计与挖掘,模型调优
这其实是一个比较宽泛的说法,所谓的用户画像,资源标签等,都是算法所涉及的部分,对场景的描述,对用户,资源内容的挖掘等等。这一块,也有许多通用的做法。nlp获取的文本信息特征,embedding迁移,cv获取的图像特征。
在模型调优这方面,也是非常重要的一环,特征的构造,结构调整(rnn,lstm,attention,embedding,bn,activation function,loss function,optimizer,learning rate,bitch size....)
从方法论的角度来讲,首先要有评估方案,离线评估特征,模型的效果,在线实验评估真实收益,

相关文章

网友评论

    本文标题:工业界做机器学习优化的方向

    本文链接:https://www.haomeiwen.com/subject/hrfykctx.html