什么是机器学习
常见的机器学习类型:
- 有监督学习:是一种通过使用带有标签的训练数据来训练模型的方法。在有监督学习中,训练数据包含输入特征和相应的目标标签。模型的目标是通过学习输入特征和目标标签之间的关系来进行预测和分类。
- 无监督学习:一种在没有标签的情况下训练模型的方法。在无监督学习中,训练数据只包含输入特征,没有与之对应的目标标签。模型的目标是发现数据中的潜在模式、结构或关系。无监督学习常用于聚类、降维和异常检测等任务。
人工智能达到较好的性能水平,必备两点:
- 拥有大量的数据;
- 能够训练一个非常大的神经网络
什么是数据集
将输入与输出相对应起来的集合,被称为数据集
获取数据集的方式:
- 手动标记
- 从观察用户行为或者其他类型的行为;
- 从网站上下载或者从合作伙伴那里获取。
IT团队和AI团队之间尽早交互与沟通,可以帮助更高效的数据集构建,防止garbage in garbage out 的情况出现。因此最好在收集数据集前,构建一个AI小组,他们可以参与到数据前期的清洗、归一化等动作中。
数据分类:
- 非结构化数据:图片、视频、文本等以非表格存在的数据
- 结构化数据:存在一张巨大表格里的数据。
AI术语
- 机器学习:学习输入,输出的映射,即自动输入A,然后输出B。让电脑在不被编程的情况下,就可以自己学习的研究领域,无需显示编程
- 数据科学:请一个团队,分析数据集得到数据里的一些提示/洞察,以帮助决策。
-
神经网络/深度学习:构建一个人工神经网络,完成A到B的映身。
image.png
什么能使一个公司擅长人工智能
并不是任何一家实现了深度学习的公司,就是一家AI公司。
- 认真对待数据获取的公司,是一个好的人工智能公司的关键成分
- 完成了一个统一数据仓库构建的公司
- 十分擅长能发发现自动化的机会
- 构建了人工智能团队的公司。拥有机器学习工程师等类似新的角色,并能通过新的方式分配任务。
如何完成AI转型:
- 启动一些小项目,获取动能;
- 内部建立一个人工智能团队;
- 进行广泛的人工智能培训。不仅对工程师,还要提供给经理、部门领导和高级管理人员’
- 制定AI战略;
- 开展广泛的内外交流。
判断一个问题能否用AI解决
到目前为止,要真正在回答这个问题很难,特别是LLM在行其道的现在。以下是两个简单原则:
- 这个问题人类是否可以1眼能看到答案;
- 现存是否有大量数据。
一些例子
- AI能做到:
- 行车时,判断车的位置,并做出是否可以继续前行的决策
- 利用大量已标的胸片学习如何诊断患者是否患肺炎
- AI做不到:
- 判断人类的手势的意图
- 仅看很少的胸片,然后输入几段教科书,学习如何诊断患者是否患肺炎
week1. https://www.coursera.org/learn/ai-for-everyone/lecture/rv1fW/what-machine-learning-can-and-cannot-do
网友评论