无监督学习
无监督学习使我们能够在很少或根本不知道我们的结果应该是什么样的情况下解决问题。 我们可以从数据中导出结构,我们不一定知道变量的影响。(预先不知道数据集有什么特征)
我们可以通过基于数据中变量之间的关系聚类数据来推导出这种结构。
在无监督学习的情况下,没有基于预测结果的反馈。
聚类算法 :把不同的个体归入不同的类或归为不同类型的人(没有提前告知算法个体是哪一类人,让算法自动找到数据集的类型,然后按照类型对个体进行分类)
例:
聚类:收集1,000,000个不同基因的集合,并找到一种方法将这些基因自动分组成不同的相似或通过不同变量相关的组,例如寿命,位置,角色等。
聚类:谷歌新闻对所有新闻的收集和分类,最终形成不同的新闻专题
聚类:组织大型的计算机集群,在大型的计算机集群中试图找出那些机器趋向于协同工作,如果将这些机器放在一起,可以让你的数据中心更高效地工作
聚类:社交网络的分析,识别哪些是要好的朋友,哪些是互相认识的朋友
聚类:市场分割,在一个客户数据集中自动找出不同的市场分割,并自动将你的客户分到不同的细分市场中,从而有助于我在不同的细分市场中进行更有效的销售
非聚类:“鸡尾酒会算法”允许您在混乱的环境中查找结构。 (即在鸡尾酒会上识别来自声音网格的个别声音和音乐)。
Octave是一个免费的开放源码的软件。使用Octave或Matlab这类的工具,许多学习算法都可以用几行代码就可以实现
很多的机器学习算法,都是先用Octave写一个程序原型,因为在Octave中实现这些学习算法的速度快得让你无法想象,只有在确定这个算法可以工作后,才开始迁移到 C++ Java或其它编译环境。事实证明,这样做实现的算法比你一开始就用C++ 实现的算法要快多了
网友评论