首先不要想着自己缺少的知识都学会了才开始机器学习,正确的方法是自上而下的学习,先定义你的问题,再准备数据,选择算法,提升结果,再展示算法的结果。
最近在学习朴素贝叶斯,偶然看到几个高质量的项目案例,列举如下:
项目案例1: 屏蔽社区留言板的侮辱性言论
项目概述
构建一个快速过滤器来屏蔽在线社区留言板上的侮辱性言论。如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标识为内容不当。对此问题建立两个类别: 侮辱类和非侮辱类,使用 1 和 0 分别表示。
项目案例2: 使用朴素贝叶斯过滤垃圾邮件
项目概述
完成朴素贝叶斯的一个最著名的应用: 电子邮件垃圾过滤。
项目案例3: 使用朴素贝叶斯分类器从个人广告中获取区域倾向
项目概述
广告商往往想知道关于一个人的一些特定人口统计信息,以便能更好地定向推销广告。
我们将分别从美国的两个城市中选取一些人,通过分析这些人发布的信息,来比较这两个城市的人们在广告用词上是否不同。如果结论确实不同,那么他们各自常用的词是哪些,从人们的用词当中,我们能否对不同城市的人所关心的内容有所了解。
完整代码地址: https://github.com/apachecn/AiLearning/blob/master/src/py2.x/ml/4.NaiveBayes/bayes.py
有时间可以详细了解下,没有时间可以收藏下,将来可以用来实现一些有趣的项目。
网友评论