milvus单机性能测试

作者: zishen | 来源:发表于2019-12-27 14:53 被阅读0次

milvus单机性能测试
Loadrunner性能测试--基础理论(一)
jmeter-如何部署分布式
Milvus：Milvus2.0官方文档学习
性能测试进阶（三）——使用jmeter+ant进行接口集成性能自
XXL-MQ v1.2.1 发布，分布式消息队列
使用JMX服务监控Java程序性能
安装启动指南
软件性能测试目录
性能测试概览目录

测试背景：
业务需求要使用向量检索库，milvus是新开源的检索库，由C++编写，支持docker，k8s分布式拓展，0.6.0版本新增表分区等新功能。官方的介绍很接地气，生态类似elasticsearch。es7.4也增加了向量的欧式L2距离等检索功能，阿里也开源了部分es向量检索插件，但是milvus可以GPU+CPU也是优势，这次就来测试一下单机性能。
测试材料：

1000w向量入库milvus（先前已经往milvus中写了将近1000w的向量）
100w检索向量(现在取本地在sqlite中的100w条向量用于检索压测)
milvus-cpu-0.6.0
4.Ubuntu18.04+docker+i5 4560CPU+16G内存(实际配置了milvus上限4G)

cache_config:
  cpu_cache_capacity: 4             # GB, CPU memory used for cache, must be a positive integer
  cache_insert_data: false          # whether to load inserted data into cache, must be a boolean

测试代码：

import sqlite3,time
import base64
import numpy as np

from milvus import Milvus, IndexType, MetricType, Status
milvus = Milvus()
milvus.connect(host='192.168.2.116', port='19530')

con = sqlite3.connect('soutu.db')
cursor = con.cursor()

test_feat = cursor.execute("""select feature from imgsearch where feature is not null limit 1000000
                    """)
con.commit()
s = time.time()
cnt = 0
time_cost = []
for item in test_feat:
    cnt += 1
    feature_str = item[0]
    feature_float = np.frombuffer(base64.b64decode(feature_str),np.float32).tolist()
    status,res = milvus.search_vectors(table_name='hznz', query_records=[feature_float], top_k=10, nprobe=512)
    if cnt%1000==1:
        s_child = time.time()
        
    if cnt%1000==0:
        cost = (time.time()-s_child)
        time_cost.append(cost)
        print(cnt,cost,'s')
e = time.time()
print("100W total cost {}s time.".format(e-s))
con.close()