https://classroom.udacity.com/courses/cs271/lessons/48688925/concepts/29449387610923
基本术语
- 完全可观测(象棋)、部分可观测(需要机器内部记忆:纸牌)
- 确定性的(象棋)、随机性的(骰子、纸牌)
- 离散(有限:象棋)、连续(无限:扔飞镖)
- 良性(非抵抗你:天气)、对抗性(象棋)
AI不确定性来源
- 传感器限制
- 对抗者干扰
- 随机性环境
- 计算机惰性
- 忽视
定义一个问题
- Initial state
- Actions (s) -> {a1, a2, a3...}
- Result (s, a) -> s'
- Goal test (s) -> T/F
- Path cost (s-a->s-a->s) -> n
Step cost (s, a, s') -> n
广度优先搜索(最短路径搜索)
树搜索所做的是状态空间上的叠加
图搜索 等代价搜索 三种遍历算法 三种遍历算的边界 A*算法-贪婪算法和等代价算法的结合 A*算法 A*算法 A*算法对h函数的依赖 贝叶斯网络 概率 概率 后验概率 贝叶斯规则 贝叶斯网络 贝叶斯规则 贝叶斯网络 条件独立 条件概率 条件独立 贝叶斯网络的优势 效应解释 D隔离 公式机器学习
机器学习
网友评论