假设一个人说他从公司偷走了150M records, 如何验证他说的是真的。





之所以可以用这个hashtrick来判断file大概多大的关键在于:
"see if the hash is suitably low". 因为文件里同一个key的:1,2,3,4,5,6,7,8,9会有很多。
比如如果一个file100万行,我们for loop经过key x = 1几十万次,取里面最小的那个hash的话 怎么样这个hash最后也会非常非常小。如果我们最后发现hash还是挺大的 说明你这个file size不太对。再加上对方output出来的lines是不是真正是存在的 可以判断对方有没有说谎

网友评论