Layout 就是数据分区那个,每个分区有一个 id,大概就是 layout,我们的 layout 其实就是为了迎合 RMI 这个接口,适配上去。
查询的话基本分成三个步骤:
- 根据 layout, 找到相交的 block
- 利用内部点的相对关系,找出一定的顺序性质
- 扫描,得到最后的结果,至于用不用二分查找未知
同使用的是 NYC 数据集,他主要做的就是,他觉得 经度和维度之间可能有的有一些函数关系,这时候这种数据的 CDF 学起来就更有难度,我们更希望学一个拟合的比较均匀的函数。
跑实验直接用 PGM-index,在实验部分说,和相关工作上说就比较好
网友评论