简介
机器学习基本概念,原理,历史,未来趋势,常见算法
语音识别
ocr工具(图像转文本)、 tts(文本转语音)、ASR_APP(语音转文本)
图像检测
机器翻译
风格迁移
NLP(自然语言处理)
搜索引擎
。。。。
算法模型 训练集 测试集 验证集
5W2H
how machines learning works:
1. select data (training data,
validation data,test data) -> 训练集 测试集 验证集
2. Model data(训练集构建相关特征的model) ->
3. Validate Model ->
4. test model ->
5. use the model ->
6. Tune model
Machines can 'learn' by analyzing large amounts of data.
它通过数据分析获得数据规律,并将这些规律应用于预测或判定其他未知数据
数据科学Work Flow:
获取(数据存在不同的格式) -> 检查和探索 -> 清理和准备 -> 建模 -> 评估 -> 最后的部署
数据科学的工作流程
- 获取:
不同的数据源,不同的数据格式- 检查和探索:
合理地检查数据
检查最极端的情况
统计测试,并将数据可视化
数据是否缺失或者不完整
Jupyter pandas matplotlib
Seaborn = 专门为统计可视化创建的库- 清理和准备
转换为适合于模型使用的格式
过滤 - 聚集 输入 - 转化- 建模
选择适当的算法,并在数据上训练出一个模型
将数据分割为训练 测试和验证的集合- 评估
模型构建完成并开始进行预测
实际值与评估之间的距离测量- 部署
一个定制的Web应用程序,甚至是一个简单的cron作业
常见机器学习算法
- 决策树(Decision Tree)
NLP
nlu 自然语言理解包括三块:
1. 领域识别
2. 意图识别
3. 槽填充
参考链接: http://www.cyzone.cn/article/159742.html
https://easyai.tech/ai-definition/machine-learning/
网友评论