K-中心点聚类（K-Medoids）

作者: Neural_PDE | 来源:发表于2021-01-12 23:59 被阅读0次

K-中心点聚类（K-Medoids）
111-文本分析之基于文本相似度的聚类
常见聚类算法分类
【机器学习】无监督学习 K-means(K-均值聚类算法）
机器学习实战Py3.x填坑记10—利用K-均值聚类算法对未标注数
《机器学习实战》笔记（十）：Ch10 - 利用k-均值聚类算法对
K-medoids聚类
动态聚类算法
第六章数据聚类算法——基于K-Means聚类算法
机器学习—K-均值聚类（K-means）算法

#install.packages("cluster")
library(cluster)
#导入数据集
data=iris[,-5]
str(data)

# mediods对iris进行聚类分析 
pam=pam(data,3)
pam
str(pam)
data[,5]=pam$cluster
head(data)

#用table函数对照准确率
table(iris[,5],kmeans$cluster)

#查看两两变量的聚类结果(只看上三角即可)
par(mfrow=c(4,4))
for (i in 1:4){
  for (j in 1:4){
  plot(data[,i],data[,j],col=pam$cluster,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
  }
}
dev.off()

#查看特征见相关图
library("corrplot")
b=cor(data)
corrplot(b,method="pie",main="\n\nCorrelation between variables")

#最后我们将分类以及中心点打印出来(选择两个对标签相关度高的特征:这样聚类结果非常明显且中心点'X'和散点最适配)这里是第3和4列
i=3
j=4
plot(data[,i],data[,j],col=pam$cluster,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
df=pam$medoids[,c(i,j)]
points(df,pch="X",cex=1.5,col=4)

#pam自带图集
layout(matrix(c(1,2),1,2)) #每页显示两个图
plot(pam)
layout(matrix(1))

#install.packages("cluster")
library(cluster)
#导入数据集
data=iris[,-5]
str(data)

# mediods对iris进行聚类分析 
clara=clara(data,3)
clara
str(clara)
data[,5]=clara$cluster
head(data)

#用table函数对照准确率
table(iris[,5],clara$cluster)

#查看两两变量的聚类结果(只看上三角即可)
par(mfrow=c(4,4))
for (i in 1:4){
  for (j in 1:4){
  plot(data[,i],data[,j],col=clara$cluster,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
  }
}
dev.off()

#查看特征见相关图
library("corrplot")
b=cor(data)
corrplot(b,method="pie",main="\n\nCorrelation between variables")

#最后我们将分类以及中心点打印出来(选择两个对标签相关度高的特征:这样聚类结果非常明显且中心点'X'和散点最适配)这里是第3和4列
i=3
j=4
plot(data[,i],data[,j],col=clara$cluster,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
df=clara$medoids[,c(i,j)]
points(df,pch="X",cex=1.5,col=4)

#clara自带图集
layout(matrix(c(1,2),1,2)) #每页显示两个图
plot(clara)
layout(matrix(1))

#install.packages("fpc")
library(fpc)
#导入数据集
data=iris[,-5]
str(data)

# mediods对iris进行聚类分析 
pamk=pamk(data,3)
pamk
str(pamk)
data[,5]=pamk$cluster
head(data)

#用table函数对照准确率
table(iris[,5],pamk$pamobject$clustering)

#查看两两变量的聚类结果(只看上三角即可)
par(mfrow=c(4,4))
for (i in 1:4){
  for (j in 1:4){
  plot(data[,i],data[,j],col=pamk$pamobject$clustering,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
  }
}
dev.off()

#查看特征见相关图
library("corrplot")
b=cor(data)
corrplot(b,method="pie",main="\n\nCorrelation between variables")

#最后我们将分类以及中心点打印出来(选择两个对标签相关度高的特征:这样聚类结果非常明显且中心点'X'和散点最适配)这里是第3和4列
i=3
j=4
plot(data[,i],data[,j],col=pamk$pamobject$clustering,pch="*",xlab=paste(names(data)[i]),ylab=paste(names(data)[j]))
df=pamk$pamobject$medoids[,c(i,j)]
points(df,pch="X",cex=1.5,col=4)

#pamk自带图集
layout(matrix(c(1,2),1,2)) #每页显示两个图
plot(pamk$pamobject)
layout(matrix(1))layout(matrix(1))
dev.off()