from tensorflow.contrib.tensorboard.plugins import projector
import cv2
1.首先要定义embedding varibles,也就是你要可视化的数据,以mnist为例,就是可视化test数据集中前2500个数据(必要):
show_num=2500
embedding_var = tf.Variable(tf.stack(mnist.test.images[:show_num]), trainable=False, name='embedding_var')
2.然后创建label文件,可以是csv,也可以是tsv文件,下面是我写的一个函数,same_file是创建文件的位置,labels就是你需要可视化数据集中的labels(可选):
def create_metadata_file(same_file, labels):
with open(file, 'w')as f:
f.write('Index' +'\t' +'Label' +'\n')
for i in range(show_num):
f.write(str(i) +'\t' +str(labels[i]) +'\n')
print('labels.tsv文件创建完成!')
3.也可以创建sprite.image_data数据,下面是函数,创建出来的图片如sprite_image.jpg所示(可选):
def create_sprite_data(same_file, images, show_num, single_image_shape=(28,28)):
n_plots =int(np.ceil(np.sqrt(show_num)))
sprite_image = np.zeros([n_plots*single_image_shape[0], n_plots*single_image_shape[1]])
num =0
flag =0
for i in range(n_plots):
y1 = i*single_image_shape[1]
y2 = y1 + single_image_shape[1]
for j in range(n_plots):
x1 = j*single_image_shape[0]
x2 = x1 + single_image_shape[0]
sprite_image[x1:x2, y1:y2] = 1 - images[num].reshape(single_image_shape)
num +=1
if num > images.shape[0]:
flag =1
break
if flag:
break
cv2.imwrite(file, sprite_image*255)
print('sprite_image创建完成!')
sprite_image.jpg
4.建立config(必要):
#下面基本是projector的固定操作
config= projector.ProjectorConfig()
embedding =config.embeddings.add()
#将需要可视化的变量与embedding绑定
embedding.tensor_name = embedding_var.name
#指定embedding每个点对应的标签信息
#这个是可选的,没有指定就没有标签信息(所以还是有必要添加的,否则最后可视化的结果只有一种颜色)
embedding.metadata_path = meta_file
#指定embedding每个点对应的图像
#这个文件也是可选的,没有指定就显示一个圆点
embedding.sprite.image_path = sprite_file
#指定sprite图中单张图片的大小,下面是mnist中的图片大小
embedding.sprite.single_image_dim.extend([28,28])
projector.visualize_embeddings(tf.summary.FileWriter(same_file), config)
6.创建saver(必要):
saver= tf.train.Saver(tf.global_variables())
saver.save(sess, same_file)
注:上面的路径最好放在同一文件夹下,否则可能出现projector可视化图中不能显示labels的情况。上面标了(必要)的步骤都是使用该API必须的操作,只需要记住就好了。
最后的结果可以在tensorboard下面的projector中看到。(因为我主要为了显示最后的可视化结果,没有将模型训练的很好,所以看起来这些个点聚类的并不是那么好!)
image.png
网友评论