美文网首页
处理大数据选择set不要用list

处理大数据选择set不要用list

作者: Noza_ea8f | 来源:发表于2020-01-31 11:30 被阅读0次

代码片段(set)

ls_9 = df_9['mmsi'].tolist()
s_9 = set(ls_9)
print(len(ls_9))
print(ls_9[1853508 - 1])
start_time = time.time()
if str(999999999) in s_9:
    end_time = time.time()
    print(end_time - start_time)

运行结果

1853508
999999999
0.0

代码片段(list)

start_time = time.time()
if str(999999999) in ls_9:
    end_time = time.time()
    print(end_time - start_time)

运行结果

1853508
999999999
0.041977882385253906

原因我也不清楚;
我曾猜测是因为set把list原有的序列打乱;
这样原来在最后一条的数据位置可能提到了前面,因此加快了查询速度;
但如果两组数据进行比对,set还是快很多的话,那么问题就别这么简单了!

相关文章

网友评论

      本文标题:处理大数据选择set不要用list

      本文链接:https://www.haomeiwen.com/subject/sykgthtx.html