2.7 无监督参数学习
无监督参数学习本质上是对数据进行分类,但是在数据分类之前已经对该数据有一定的标记。比如淘金,我们首先要用振动筛将大块的石头和金沙分开,然后用流水冲洗金沙,金子密度大,就会在分拣器中留下来,这就是淘金的过程。在这个过程中,我们需要用到合适的筛眼和振动频率和幅度,筛眼过大,会使得太多石头会留在筛选带上,筛眼过小,会让金子也被丢弃。另一方面,振动筛的振动频率和振幅也要合理设计,如果设计不合理,就无法有效分离泥沙和金子。最后,我们也需要合适的流水速度,水流速度过大,也会将金子冲走,水流速度过小,会将大量的泥沙留在分拣器中。所以在分类泥沙,石头和金子的混合物时,我们需要有合适的振动,合适的筛子,合适的流水速度。振动,筛子,流速,就是三个可以转动的旋钮,最终通过搜寻相应旋钮的相应参数(即设置参量数值),就可以有效地淘到黄金。
2.8 非参数学习
参数不确定的学习目前不是本课程的关注点,在这类学习算法里,数据的内在结构并不清楚。这些结构的个数无法事前就确定,我们获得的数据本身就意义不明确,它的特征对于我们来说,就是一个黑匣子。所以我们可能会使用一系列的方法来筛选出特征来。比如,在信号精细处理过程中,我们可以用小波变换或者压缩感知来将噪声中的特征信号过滤出来,然后根据这些特征信号来进行学习。如果我们不使用过滤这一个过程,那么数据就是非常浑浊的脏数据,它会大大影响学习的效率。在数据过滤这个过程中,参数完全是未知的。类似这种学习算法,在某些特别的领域,它们的作用也非常强大。
网友评论