1、分类问题综述
日常生活中我们每天都进行着分类过程 “这个人一看就很有钱”
分类算法的任务就是构造分类器f。
2、朴素贝叶斯分类
核心算法:
由购买iphone(类别)中硕士(特征)的概率推算硕士(特征)中买iphone(类别)的概率3、例题分析
求p(嫁|不帅、性格不好、身高矮、不上进)的概率
4、朴素贝叶斯算法的朴素一词解释
朴素即需要特征之间相互独立 有时会牺牲一定的分类准确率
假设独立的原因:1、特征太多 2、符合样本太少
p(不帅、性格不好、身高矮、不上进|嫁) = p(不帅|嫁)*p(性格不好|嫁)*p(身高矮|嫁)*p(不上进|嫁)
p(不帅、性格不好、身高矮、不上进) = p(不帅)*p(性格不好)*p(身高矮)*p(不上进) 这是错的!!!
p(不帅、性格不好、身高矮、不上进) = p(嫁)*p(不帅|嫁)*p(性格不好|嫁)*p(身高矮|嫁)*p(不上进|嫁) +
p(不嫁)*p(不帅|不嫁)*p(性格不好|不嫁)*p(身高矮|不嫁)*p(不上进|不嫁)
5 、朴素贝叶斯分类的优缺点
优点:算法逻辑简单 易于实现 分类过程时空开销小
缺点:属性之间互相独立的假设往往不成立
网友评论