索引是模型:B-Tree-Index可以被看作是一个模型,用于将键映射到排序数组中的记录位置,哈希索引作为模型将键映射到记录中的记录位置未分类的数组和一个BitMap-Index作为模型来指示数据记录是否存在。在这个探索性研究文件中,我们从这个前提开始,并假定所有现有的指标结构都可以用其他类型的模型取代,包括我们称为学习指标的深度学习模型。关键的想法是模型可以学习查询键的排序顺序或结构,并使用这个信号来有效地预测记录的位置或存在。我们从理论上分析了在哪些条件下,学习指标优于传统指标结构,并描述了设计学习指标结构的主要挑战。我们的初步结果表明,通过使用神经网络,我们能够在高速缓存优化的B-Tree上实现高达70%的速度,同时通过几个真实世界的数据集在内存中节省数量级。更重要的是,我们相信通过学习模型取代数据管理系统的核心组件对于未来的系统设计有着深远的影响,而且这项工作只是提供了一些可能的一瞥。
网友评论