(1)监督学习和无监督学习的区别
总结:监督学习会对数据的输入有确定的输出,如肿瘤是良性的,或者肿瘤是恶性的;而无监督学习只知道数据的输出,通常数据的输出是不知道的,如所有数据只知道它们都是肿瘤,而具体的良性或恶性的却不知道.
(2)聚类分析
例子1:Google新闻会对描述同一事件的新闻进行聚类整理.当你点开一个标题块时,会发现块内的三个不同URL指向三家不同媒体对同一事件的报道.
例子2:假设目前拥有大量的用户数据,但我们并不知道每个用户属于哪个细分市场,同时我们也不知道有哪些细分市场,此时就需要聚类算法来帮助我们把不同的用户分为不同的细分市场,针对每个细分市场制定销售策略.
总结:聚类分析就是把一些看起来相同的数据根据某些特性(如内容相关度)划分成不同的类.
网友评论