2020-12-02学习笔记

2020-12-02学习笔记

作者: syat_e6da | 来源:发表于2020-12-03 16:40 被阅读0次

2020-12-02学习笔记
Flink doc
场景1：电脑本地web页面播放服务器录像
散瓣花二水湖50hb7018
MARKDOWN学习笔记
2020-12-02 生而为人何为正确01
2020-12-02
2020-12-02学习记录
ReactNative学习笔记(从基本概要到控件间传值)
Kotlin学习笔记：类和接口

读论文：Reinforcement Learning to Rank in E-Commerce Search Engine: Formalization, Analysis, and Application（SIGKDD2018）

主要还是在DDPG的框架里解决search session的问题。actor产生的动作向量与item embedding做内积得到score来做推荐。状态s是一个累加的状态。
在文中进行了该问题马尔科夫性的证明。
reward存在的问题：高方差和分布不均。（Firstly, the reward variance is high because the deal price m(h) normally varies over a wide range. Secondly, the immediate reward distribution of (s, a) is unbalanced because the conversion events lead by (s, a) occur much less frequently than the two other cases (i.e., abandon and continuation events) which produce zero rewards.）所以这篇文章用了一个类似model-based的方法，先用数据预训练了（继续概率c，结束概率l，购买概率b以及购买平均收入m）用于实际的Q值计算。更新Q网络的公式如下：

critic网络更新公式

Q函数推导：

Q函数推导

总结：所以这篇论文里面没有用target网络来拟合Q（ $s^,,a^,$ ）,而是用离线数据先求得了转移概率，整体方案类似于model-based + model-free。

相关文章

2020-12-02学习笔记
读论文：Reinforcement Learning to Rank in E-Commerce Search E...
Flink doc
2020-12-02 Application state is a first-class citizen in ...
场景1：电脑本地web页面播放服务器录像
2020-12-02 思维导图第一步:播放本地录像源码路径：https://github.com/Wonton...
散瓣花二水湖50hb7018
原创李大叔清江风情 2020-12-02 图谱编号：ESB_TP_50_hb7018 直径：~36.4mm 厚...
MARKDOWN学习笔记
标题 # MARKDOWN学习笔记 MARKDOWN学习笔记 MARKDOWN学习笔记- MARKDOWN学习笔记...
2020-12-02 生而为人何为正确01
【2020-12-02日精进第198天/1825】表现：8分一、体验（描述事实，情绪，感受） 1.为自己的幸...
2020-12-02
2020-12-02 这个日子红袖添香树木花草云层云层里渗出的阳光都缩紧了身子天天路过的新建...
2020-12-02学习记录
今天早上继续学习洛洛老师的拓者课程，讲到一点，深度思考。什么是深度思考呢，如果一个问题，你想到的答案，跟其他大部...
ReactNative学习笔记(从基本概要到控件间传值)
ReactNative学习笔记1.1 ReactNative学习笔记1.2 ReactNative学习笔记1.3 ...
Kotlin学习笔记：类和接口
Kotlin学习笔记：概述Kotlin学习笔记：基本语法和函数Kotlin学习笔记：类和接口Kotlin学习笔记：...

网友评论

本文标题：2020-12-02学习笔记

本文链接：https://www.haomeiwen.com/subject/fiiywktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2020-12-02学习笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！