https://classroom.udacity.com/courses/cs271/lessons/48688925/concepts/29449387610923
基本术语
- 完全可观测(象棋)、部分可观测(需要机器内部记忆:纸牌)
- 确定性的(象棋)、随机性的(骰子、纸牌)
- 离散(有限:象棋)、连续(无限:扔飞镖)
- 良性(非抵抗你:天气)、对抗性(象棋)
AI不确定性来源
- 传感器限制
- 对抗者干扰
- 随机性环境
- 计算机惰性
- 忽视
定义一个问题
- Initial state
- Actions (s) -> {a1, a2, a3...}
- Result (s, a) -> s'
- Goal test (s) -> T/F
- Path cost (s-a->s-a->s) -> n
Step cost (s, a, s') -> n

广度优先搜索(最短路径搜索)
树搜索所做的是状态空间上的叠加

























机器学习

网友评论