文献阅读 — Clustering by Fast Search

作者: binzeng | 来源:发表于2017-08-28 09:22 被阅读0次

文献阅读 — Clustering by Fast Search
论文 | 通过快速查找和发现密度峰值进行聚类
基于密度峰值的快速聚类算法（CFSFDP）
聚类方法：Clustering by fast search a
Multithreading 信息收集
Ala retrieval
一步一步带你安装史上最难安装的 vim 插件 —— YouCom
Faster RCNN的一些Note
DBGWAS：基于k-mer和De Bruijn图的GWAS
Faster R-CNN

由于简书不方便编写公式，涉及公式部分全部截图，原始ipynb文件点这里。

聚类(clustering)是一类典型的无监督学习（unsupervised learning）方法，它通过对无标记训练样本的学习将数据集中的样本划分为若干个通常是不相交的子集（簇/cluster）。聚类分析的目标是基于元素的相似性进行归类，在生物信息学和模式识别等领域有着广泛的应用，常用的聚类算法有：knn、K-means、K-medoids、DBSCAN等。

作者主要做了什么工作？

首先，作者提出了一个核心假设：类簇中心（cluster center）周围都是低局部密度（low local density）的点，并且与任何一个局部密度较高（a higher local density）的点保持相对较远的距离；基于这个假设，作者提出了一种新的、不需要迭代的快速聚类方法（paper中没有给这个方法命名，这里暂且称之为Fast-Cluster）。