Lecture4

作者: 数科每日 | 来源:发表于2021-05-21 22:36 被阅读0次

Lecture4 视频链接
Reporter: Jonas Peters


第三部分: 在机器学习中的应用

半监督机器学习

对于X_{1} ,X_{2} .... X_{n} 存在 Y_{1} ,Y_{2} .... Y_{n}, 对于 X_{1+n} ,X_{2+n} .... X_{m+n} 不存在已知的答案。 希望借由 X_{1+n} ,X_{2+n} .... X_{m+n} , 提升前半部分的有监督机器学习(先对X进行聚类, 然后帮助有监督学习)。

马尔科夫分解带来的模块化
image.png

举例

image.png
推出结论

进一步的:


image.png

结论是:由于 p(cause)p(effect|cause) 独立, 所以 p(cause) 并不能帮助有监督学习部分提升。所以, 半监督学习的想法无效。

image.png

Half-sibling Regression

image.png image.png

举的例子是 开普勒望远镜搜索地外行星的例子, 搜索地外行星依赖的的是观察那些恒星的光线会变暗。

image.png

讲着希望, 能够从 Y 中去掉 可以被 X 解释的部分。 因为可以被X解释的部分, 就是噪音。 因为 Y 和X 是 sibling, 所以这种回归叫 Half-sibling 回归。

image.png

这是结果, 第二行是使用这个回归出来以后的结果。 据他说, 效果很好。 蓝色的点, 就是地外行星信号, 可以看出来周期很规律。

image.png

增强学习

image.png

还回到之前那个肾结石的例子中去。依据 Markov 分解, p(r, t, s) 可以分解为三个互相独立的部分, 其中 p(t | s) 代表的意思是, 依据结石大小来选择治疗方案的分布。
基于第一个公式,引申一下, 如果想通过改善治疗方案分配, 而获得最佳的治疗结果, 实际上就是在结石大小(S)这个状态下, 选择最优的 治疗方法 (Action)。 这其实就是增强学习的奥义。

例子 21点 (BlackJack)
image.png image.png image.png image.png image.png
例子 广告
image.png
例子 转移学习
image.png image.png

总结

image.png

相关文章

网友评论

      本文标题:Lecture4

      本文链接:https://www.haomeiwen.com/subject/cbcgjltx.html