华工机器学习培训笔记

华工机器学习培训笔记

作者: Swifer | 来源:发表于2018-07-24 09:48 被阅读312次

华工机器学习培训笔记
逻辑回归
多元线性回归
中欧EMBA学习笔记-《管理经济学》（1）机会成本向后看，沉没成
内容整理（持续更新）
机器学习笔记1
华工
00-Scikit-learn学习笔记系列文章
[机器学习入门] 李宏毅机器学习笔记-5（Classificat
机器学习笔记

Day1

一、上午

传统程序：数据 + 程序 -> 电脑 -> 输出
机器学习：数据 + 输出 -> 电脑 -> 程序
条件概率、边缘概率、联合概率、参考；
贝叶斯公式、贝叶斯网络、概率的链式法则（重点理解）、参考；
概率图模型（自学，即贝叶斯网络和马尔柯夫网络）;
概率密度函数、Transformed Densities（不理解）、参考；
最大似然估计、最大后验估计、参考；
自信息：不确定性的消除；
概率：事件的不确定性程度；
熵、联合熵、条件熵、相对熵、交叉熵、参考
导数的链式求导法则

二、下午

数据、代价函数、最小化代价函数、
最小二乘法（推导）、正则化、梯度下降、线性回归（FIT，拟合）
线性分类、支持向量机（软间隔、hinge loss）、各种损失函数
随机梯度下降、批次随机梯度下降（节约内存）
Adma（AdaGrad + RMSProp）（重点理解！面试必考！）
AdaGrad：适用于稀疏梯度；当梯度较小时，下一步跑得慢；梯度较大时，下一步跑得快。
RMSProp：自适应学习率。
牛顿法：每一步梯度都由一个 xxx 矩阵确定，但是复杂度高。（自学）
优化算法：分布式（中心化（工业界常用）、去中心化）、量化

梯度下降矩阵计算.png

三、晚上

Linux（环境变量、常用命令）

man： Linux 下的帮助指令。
which：用于查找并显示给定命令的绝对路径。
free：显示当前系统未使用和已使用的内在数目。-h：以可读的方式显示。
df：显示磁盘分区上的可用空间。挂载点
top：系统的运行情况。（load：1、5、15 分钟的负载情况）

GPU 的基础概念
Docker的基础概念
NVIDIA Docker 的基础概念 (deepo、docker hub)
实验、及相关代码

Day2

一、上午

大纲

大纲.png

1. 线性模型：单层感知机（sign -> (-1, 1)）、逻辑回归（sigmoid -> (0,1)）。

2. 决策树（详见《机器学习》)：

决策树学习基本算法

2.1. 纯度：the degree that the samples in one leaf node belong to the same class
2.2. 信息熵：平均而言发生一个事件我们得到的信息量大小。
2.3. 信息增益：熵 - 条件熵，在一个条件下，信息不确定性减少的程度。（ID3）
2.4. 增益率：惩罚参数 * 信息增益。（C4.5)
2.5. 基尼系数：是一种与信息熵类似的做特征选择的方式，可以用来数据的不纯度。（CART）

3. 集成学习（详见《机器学习》)

集成学习.png

3.1. 基分类器
3.2. 加性模型

4. AdaBoost（如何训练、合并、更新数据分布）（一堆数学公式……）

4.1. 流程：

AdaBoost 算法流程.png

4.2. 伪代码：

AdaBoost 伪代码.png
4.3. 理论分析：错误率有上界；模型自由率比较小，不容易过拟合；
4.4. AdaBoost 的局限性：等价对待正例和负例。

4.5. 解决：代价敏感学习

AdaBoost 局限性解决 - 代价敏感学习.png
4.6. AdaCost

image.png

AdaCost.png

5. GBDT（基于回归树）

5.1.动机

image.png

image.png

5.2. 训练基分类器

1.png

3.png
5.3. 组合分类器：加性模型

image.png

5.4. 改变数据分布：残差。
5.5 伪代码

梯度提升算法 -伪代码.png

GBDT 伪代码（第 3 步）.png

6. XGBoost

6.1. 过拟合、欠投合、偏差、方差

新的目标函数.png

6.2. XGBoost 目标函数

XGBoost 目标函数.png
6.3. How to learn? （……一堆公式+一堆例子，这一部分完全没听懂）

7. 剪枝、正则化

image.png

8.准确度

image.png

9.总结

image.png

10. 附件： XGBoost的实验手册、调参

二、下午

大纲

day02 下午大纲.png

照片的形成.png

像素值相关.png

图片存储.png
没怎么听……不太感兴趣……

三、晚上

如何做实验及管理实验

1. Research Workflow

工作流程.png

2.模型设计

Model Design.png

3. 训练数据

Training Data.png

4. 目录结构

Directory Structure.png

checkpoints：用来保存中间结果。
opts（即 configure）：放所有超参数等各种设置。
main：训练和测试的代码。

5. 命名及注释

train and annotation.png

6. 管理结果

Result Management.png

Day6

一、上午推荐系统

1. 流程

推荐系统工作流程.png

2. 协同过滤：过对用户历史行为数据的挖掘发现用户的偏好，基于不同的偏好对用户进行群组划分并推荐品味相似的商品。

协同过滤.png

2.1. 协同过滤分类

协同过滤分类.png

2.2. 协同过滤的基本方法

image.png

3. User-based 模型

User-based 模型.png

3.1. 基本问题

User-based 模型的三个基本问题.png

3.1.1 相似度（套一个PCC公式，皮尔森）

相似度计算.png
3.1.2. 计算总分

总分.png
3.1.3. 取几个近邻（经验值）

近邻数.png

3.2. 模型的优化

User-based 模型优化，近邻算法.png
3.3 模型分析

image.png

4. Item-based 模型

4.1 模型的直观理解：利用其他相似值相同的 item，来评估 target item。

image.png

4.2 相似度计算：PCC 或者余弦相似度

image.png
4.3 预测
[图片上传失败...(image-749553-1532742673361)]

4.4 优势：可以做离线预测。

5. 以上两个模型的基本问题：冷启动（content-based, 迁移学习）

image.png

6. Model-based 模型（难）

推荐的论文.png

使用 SVD 去 xxx.png

矩阵的评估.png

7. 聚类模型

image.png

8. 概率模型

[图片上传中...(image.png-952044-1532744092074-0)]

9. 分类模型

image.png

10. content-based 模型

image.png

11. learn to rank

image.png

二、Deep learning for RS

1.主流模型

image.png

image.png

image.png

image.png

相关文章

华工机器学习培训笔记
Day1 一、上午传统程序：数据 + 程序 -> 电脑 -> 输出机器学习：数据 + 输出 -> 电脑 -> 程...
逻辑回归
点击链接：逻辑回归 NG机器学习公开课笔记：机器学习笔记
多元线性回归
链接：多元线性回归 NG机器学习公开课笔记：机器学习笔记
中欧EMBA学习笔记-《管理经济学》（1）机会成本向后看，沉没成
暂停4天《华与华工作法》文章撰写，用来整理4天中欧学习笔记。中欧EMBA学习笔记——《管理经济学》（1）机会成本...
内容整理（持续更新）
机器学习基础视频教程：吴恩达机器学习-网易云公开课笔记地址：机器学习笔记作业练习：https://github....
机器学习笔记1
机器学习笔记1
华工
今天在华工培训，喜欢校园的感觉，想你～
00-Scikit-learn学习笔记系列文章
机器学习读书笔记撰写机器学习读书笔记，总结自己系统学习sklearn的经验，将整个学习过程写成读书笔记的形式分享...
[机器学习入门] 李宏毅机器学习笔记-5（Classificat
[机器学习] 李宏毅机器学习笔记-5（Classification: Probabilistic Generati...
机器学习笔记
学习Andrew Ng的机器学习教程，做个笔记。初识机器学习人工智能的核心是机器学习，机器学习的本质是算法机...

网友评论

本文标题：华工机器学习培训笔记

本文链接：https://www.haomeiwen.com/subject/whedmftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|华工机器学习培训笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！