机器学习准备:
1;耐心调优;
2;人员组成
项目经理
业务专家
机器学习工程师
数据建模人员
可视化人员
评估人员
其他
3;基础准备
机器学习分为支撑学科(比如基础数据结构与算法、概率与数理统计、开发语言和开发工具、特征处理、基础开发能力、架构设计)和机器学习本身的研究理论
机器学习平台Python集成环境:Anconda、geogle开源工具TensorFlow、Inter的Caffe
机器学习应用:
1;艺术领域
机器作诗、机器学习大师风格
2;金融领域
信用评分
欺诈检测
股票市场预测
选股、股票助手
客户关系管理
智能客服
3;医疗领域
预测患者的诊断结果
制定最佳疗程
评估风险等级
病理分析
个性化医疗
建立预测模型
3;自然语言处理
分词、信息检索
词性标志、信息抽取
句法分析、文字校对
自然语言生成、问答系统
文本分类、机器翻译、自动摘要
4;网络安全
反垃圾邮件、反钓鱼网络、上网内容过滤
反欺诈、防范攻击、活动监视、密码破解
5;工业领域
质量管理、灾害预测、缺陷管理、工业分拣、故障感知
缺陷:机器学习的不可解释性
6;娱乐行业
预测票房、视频识别、广告计划管理器(实现千人千面)给用户进行画像
7;社交网络分析
机器学习的流程:
明确分析目标、数据收集、数据预处理、建模分析、结果评估、、部门部署
数据的噪声冲突、脏数据、不符合数据建模的要求,比如决策树会对数据有类别的要求;
如移动运营商设计套餐和营销活动可以使用聚类算法,对客户的流失进行预测可以使用多层前馈网络的方法;
数据的预处理包括:数值属性的标准化、变量相关性分析、异常值分析。
人工智能实际应用问题可以分为监督学习(回归、分类)、非监督学习(聚类),聚类在进行分类之前都会进行虚拟的设置分类数目;
回归:是一种用于连续性数值变量预测和建模的监督学习算法;目前回归算法最为常用的有四种:线性回归(正则化)、回归树(集成方法)、最邻近算法和深度学习。
分类算法是用于分类变量建模及预测的监督学习算法,往往适用于类别的预测,最为常用的算法为:逻辑回归(正则化)、分类树(集成方法)、支持向量机、朴素贝叶斯和深度学习方法。
聚类任务是基于数据内部结构来寻找样本集群的无监督学习任务,使用案例包括用户画像、电商物品聚类、社交网络分析等,最为常用的算法主要有四种:K均值、仿射传播、分层/层次和聚类算法
网友评论