模型效果上限预估、分类模型Bad Case分析方法 给定训练和测试数据集,训练某个二分类模型(如,GBDT算法),...[作者空间]
机器学习模型交叉验证脚本 本文以阿里云机器学习平台上的 ps_smart (GBDT)算法为例,提供一个搜索最佳超...[作者空间]
一、推荐算法为何要精做特征工程 机器学习工作流就好比是一个厨师做菜的过程,简单来说,清洗食材对应了清洗数据,食材的...[作者空间]
摘要:深度学习时期,与CV、语音、NLP领域不同,搜推广场景下特征工程仍然对业务效果具有很大的影响,并且占据了算法...[作者空间]
在推荐算法领域,时常会出现模型离线评测效果好,比如AUC、准召等指标大涨,但上线后业务指标效果不佳,甚至下降的情况...[作者空间]
有时候我们会遇到推荐算法上线之后,效果不如预期的情况。这种情况下,该如何改进呢? 下面就尝试列出一些检查清单,按照...[作者空间]
为什么需要冷启动 通常推荐系统通过协同过滤、矩阵分解或是深度学习模型来生成推荐候选集,这些召回算法一般都依赖于用户...[作者空间]
粗略来看,推荐算法可以简单地分为召回和排序两个阶段。召回模块负责从海量的物品库里挑选出用户可能感兴趣的物品子集,过...[作者空间]
梯度提升(Gradient boosting)是一种用于回归、分类和排序任务的技术,属于Boosting算法族的一...[作者空间]
推荐系统已经成为互联网应用提升点击率、转化率、留存率和用户体验的必备手段,然而,随着流量和数据量的爆发式增长,以及...[作者空间]
【关于作者】 本书作者团队曾出版过4本《纽约时报》畅销书,即《关键对话》《关键冲突》《关键影响力》《关键改变》。 ...[作者空间]
Note: 原文发表于我的知乎专栏:算法工程师的自我修养,欢迎关注! Methods that scale wit...[作者空间]
标签: crontab 调度 虽然现在越来越多的开源机器学习工具支持分布式训练,但分布式机器学习平台的搭建和运维的...[作者空间]
一、何为类加载器 我们编写的.java文件经过编译器编译之后,生成.class文件,即字节码文件,类加载器就是负责...[作者空间]
提供好的特征是机器学习任务中最重要的工作,那么何为优秀的机器学习特征?以及如何高效地组合这些特征? 以二分类问题为...[作者空间]