Faiss学习：一

Faiss学习：一

作者: momo猪 | 来源:发表于2017-03-24 10:11 被阅读7458次

Faiss学习：一
faiss学习笔记（一）
faiss的安装使用
Ubuntu 16.04 下 faiss 安装笔记
faiss学习笔记（二）
Faiss那点事~
记一记faiss安装
手把手教你安装Faiss（Linux）
faiss安装
Faiss

在多个GPU上运行Faiss以及性能测试

一、Faiss的基本使用

1.1在CPU上运行

Faiss的所有算法都是围绕index展开的。不管运行搜索还是聚类，首先都要建立一个index。

import faiss
# make faiss available
index = faiss.IndexFlatL2(d)
# build the index
# d is the dimension of data

在运行上述代码后，就可以添加数据并运行搜索了。

index.add(xb)
# xb is the base data
D, I = index.search(xq, k)
# xq is the query data
# k is the num of neigbors you want to search
# D is the distance matrix between xq and k neigbors
# I is the index matrix of k neigbors

1.2在单个GPU上运行

在单个GPU上运行的语法基本与在GPU上运行类似。但是需要申明一个GPU资源的标识.

res = faiss.StandardGpuResources()
# we need only a StandardGpuResources per GPU
flat_config = 0
# flat_config is an ID. if you have 3 GPUs, flat_configs maybe 0, 1, 2
index = faiss.GpuIndexFlatL2(res, d, flat_config)
# build the index
index.add(xb)
D, I = index.search(xq, k)

1.3在多个GPU上运行

在多个GPU上运行时便有所不同，我们需要将数据集分割给多个GPU以完成并行搜索。

在Faiss中提供了两种方法实现：IndexProxy和IndexShards。

下面着重介绍IndexProxy。

res = [faiss.StandardGpuResources() for i in range(ngpu)]
# first we get StandardGpuResources of each GPU
# ngpu is the num of GPUs

indexes = [faiss.GpuIndexFlatL2(res[i], i, d, useFloat16)
           for i in range(ngpu)]
# then we make an Index array
# useFloat16 is a boolean value

index = faiss.IndexProxy()
for sub_index in indexes:
    index.addIndex(sub_index)
# build the index by IndexProxy

二、kmeans测试

1.jpg

如图所示数据为1M个，中心点为1K个。

在不同数据维度以及GPU数目下迭代20次所需要的时间。

三、暴力搜索测试

数据集为sift1M，该数据集共1M个，128维。（运行在两个K40M GPU上）

2.jpg

3.jpg

可以看到在每次查询10K个数据的1024个最近邻居时平均每个查询只需360ns。当需要查询的邻居数下降时，查询时间能够降至100ns。

四、IVFPQ搜索测试

数据集同上，运行环境同上。

基本参数：

numCentroids=4096
numQuantizers=64

首先我们测试nprob对性能的影响

4.jpg

当nprob上升时，每次查询时间会增加，同时查询的准确度也会上升。但上升到一定程度上升幅度便会迅速变小。我们取准确度的拐点值nprob=32进行下一步测试。

接下来我们测试查询的邻居数即k值对性能的影响。

5.jpg

可以看到查询时间不再是线性增长了。也就意味着对于IVFPQ邻居数不宜太多。

选定k=32进行下一步测试。

6.jpg

如图所示，随着每次查询的数量上升，平均查询时间先变小在变大，这可能是由于数据量小时开销比较大导致平均查询时间较大。可以看到随着查询的数量上升，平均查询时间上升但上升幅度放缓，估计会在250ns左右稳定。

相关文章

Faiss学习：一
在多个GPU上运行Faiss以及性能测试一、Faiss的基本使用 1.1在CPU上运行 Faiss的所有算法都是...
faiss学习笔记（一）
1、构建训练数据和测试数据上面我们构建了shape为[100000,64]的训练数据xb和shape为[1000...
faiss的安装使用
1. Faiss简介 Faiss是Facebook开源的一款用于大规模P维向量最近邻检索的工具。 Faiss is...
Ubuntu 16.04 下 faiss 安装笔记
前言 faiss 简介三月初，Facebook AI Research（FAIR）开源了一个名为 Faiss 的...
faiss学习笔记（二）
加速搜索如果需要存储的向量太多，通过暴力搜索索引IndexFlatL2速度很慢，这里介绍一种加速搜索的方案，索引...
Faiss那点事~
最近看了下Faiss的原因，今天让我们来Faiss那点事~全名叫Facebook AI Similarity Se...
记一记faiss安装
背景近期服务迁移到阿里云，发现一个服务依赖faiss,本以为简单的pip install faiss 即可解决，...
手把手教你安装Faiss（Linux）
前言由于最近项目组引用Faiss库（Faiss是由Facebook AI Research研发的为稠密向量提供高...
faiss安装
在运行代码时，服务依赖faiss，本以为简单的pip install faiss即可解决，却发现安装之后，尝试导入...
Faiss
Faiss核心算法实现 Faiss是FAIR出品的一个用于向量k-NN搜索的计算库，其作用主要在保证高准确度的前提...

网友评论

矢量搜索库faiss

本文标题：Faiss学习：一

本文链接：https://www.haomeiwen.com/subject/cpbxottx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

矢量搜索库faiss

热点阅读

矢量搜索库faiss

关于我们|服务条款|联系我们|Faiss学习：一|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！