1 简介

乘积量化（PQ）算法是和VLAD算法是由法国INRIA实验室一同提出来的，为的是加快图像的检索速度，所以它是一种检索算法，在矢量量化（Vector Quantization，VQ）的基础上发展而来，虽然PQ不算是新算法，但是这种思想还是挺有用处的，本文没有添加公式。

它原文中是接在VLAD算法后面，假设我们使用VLAD算法获得了1M的图像表达向量，向量的维度为D=128，则对于一幅查询图像来说，我们需要计算1M个余弦距离，这样实时性就比较差。所以如何加快这种距离的计算速度就是PQ算法所要完成的任务。当然为了解决这个问题，已经有很多算法被提出了，如KDTree，LSH，ITQ等都是为解决这个问题而提出的，属于KNN或ANN范畴。

2 空间切分

首先，PQ先将D维空间切分成M份：即将128维空间切分成M个D/M维的子空间，如下图所示M=8（在原文中，作者由于是在PCA之后进行的PQ检索，所以进行了一个随机旋转，因为PCA之后特征值的顺序是按照从大到小排列的）

image

用代码表示就是把向量维度切分：

int ds= d / nsq; for ( int i = 0; i < nsq; i ++ )
{ for ( int j = 0; j < ds; j ++ )
    {
        vs.push_back( vtrain.row( i*ds + j ) );
    }
} //vtrain的转置是原始128维向量，vs是其中的一个子向量

3 量化

这样就可以在每个子空间内都会有1M个短向量，我们为每个子空间单独训练一本码书，图中码书规模为k=256，维度d=D/M=128/8=16，代码只要在上面的外循环中添加k-means聚类即可。
　　到这里我们就有M=8本子码书，下面我们依次量化每个子空间的数据，量化的过程就是计算每个短向量距离最近的聚类中心，距离就是L2距离。

4 压缩

现在考虑一个D=128维的原始向量，它被切分成了M=8个d=16维的短向量，同时每个短向量都对应一个量化的索引值，索引值即该短向量距离最近的聚类中心的编号，每一个原始向量就可以压缩成M个索引值构成的压缩向量，只要设计好了数据结构，就可以获得所有1M数据的压缩向量。压缩向量其实就是M个索引值，每个索引值对应一个聚类中心，所以要同时保存压缩向量和聚类中心。

其实一个向量被8个索引值同时索引，而如果把这8个索引值转换成一个的话是多大呢，k的M次方，这里应该是256的8次方，这是一个很大很大的数，而上面的操作就等效于生成了一个这么大规模的码书。为什么这么说呢，因为每一个短向量（或称子向量）量化的过程都有k个选择，而一个原始向量有M个选择，类似于8位256进制的数可以表示的最大数值：

对于query图像的原始向量也经过上述流程的切分和量化过程，最后生成同样的M维压缩向量。

5 距离计算

对于训练数据和测试数据都压缩完成后，接下来就是讨论如何计算两个压缩向量之间的距离呢？而且是快速的计算。

作者提供了两种距离计算方式，分别为 “对称距离计算” 和 “非对称距离计算” ，分别如下左右图所示：

image

对称距离计算：直接使用两个压缩向量x，y的索引值所对应的码字q(x),q(y)之间的距离代替之，而q(x),q(y)之间的距离可以离线计算，因此可以把q(x),q(y)之间的距离制作成查找表，只要按照压缩向量的索引值进行对应的查找就可以了，所以速度非常快；

非对称距离计算：使用x，q(y)之间的距离代替x，y之间的距离，其中x是测试向量。虽然y的个数可能有上百万个，但是q(y)的个数只有k个，对于每个x，我们只需要在输入x之后先计算一遍x和k个q(y)的距离，制成查找表（因为只有k个，所以速度是非常快的），然后按照y对应的压缩向量索引值进行取值操作就可以了。