CMU 15445 6.B+树 + homework2

CMU 15445 6.B+树 + homework2

作者: 西部小笼包 | 来源:发表于2019-05-28 20:05 被阅读0次

CMU 15445 6.B+树 + homework2
CMU 15445 7.skip list + radix tr
CMU 15445 10. 连接
CMU 15445 Project 4 实现Logging An
CMU 15445 15. TO + OCC + MVCC
CMU 15445 12. 并发模型
CMU 15445 11. Query 优化
CMU 15445 8. Query plan
CMU 15445 13.并发控制理论
CMU 15445 Project 3 实现Lock Manag

https://15445.courses.cs.cmu.edu/fall2018/slides/07-trees1.pdf

表索引

表索引是表的列子集的副本，这些列的组织和/或排序使得可以进行快速访问。
但是如果表索引创建过多，会有维护成本（插入删除要更新索引文件）和额外的存储成本(每建一个索引多一个索引文件）。
b+树的基本概念这边不过多介绍。

重点讲解下homework2 里的b+树是怎么分裂和合并的。
https://15445.courses.cs.cmu.edu/fall2018/files/hw2-clean.pdf

image.png

综上需要走4个指针。

image.png

第一题解

image.png

第二题解

先找到18要插的叶子节点，随后发现满了。开始做分裂，前半部分和后半部分断开，后半部分的指针指到19.前半部分的指针指向后半部分。同时为了链接前半部分和后半部分，父亲节点需要多一个，以后半部分的第一个为值，插入父节点。

image.png

image.png

第三题解

image.png

借过来之后，需要把父亲节点更新为右边最左元素的值。

image.png

第四题解

首先删掉了31，没有元素可借，触发第一次合并。32到左边那里去，同时删掉父节点的30.
随后父节点没元素了，，再次触发合并，合并用的是下面已经合并的那个节点的最左端的值，同时删除祖父节点26.

image.png

image.png

image.png

第一题解

这道题就是分裂2次，因为父亲节点也满了，按照相同套路再分裂一次。

image.png

image.png

第二题解

image.png

image.png

B+树特性

1. 节点大小

B +树的最佳节点大小取决于磁盘的速度。想法是通过尽可能多的键/值对来分摊从磁盘读取节点到内存的成本。
磁盘越慢，则构思节点大小越大。
有些负载可能是区域扫描更多，而不是单键查找。

2. 合并的阈值

有些DBMS在半满时并不总是合并。
延迟合并操作可能会减少重组量。
DBMS可能更好地发生下溢，然后定期重建整个树以重新平衡它。

3. 变长的KEY

•指针：存储键作为元组属性的指针（很少使用）。
•可变长度节点：B +树中每个节点的大小可能不同，但需要仔细的内存管理。这种方法也很少见。
•键映射：嵌入一组指针，指针是映射到节点key+value 列表。这类似于之前讨论的slotted page。这是最常用的方法。

image.png

4. 非唯一的KEY

允许KEY重复多次

image.png

只出现一次，VALUE用链表连起来

image.png

5.节点内部的查找

也有3种方法，线性查找。二分查找（PROJECT里我选用这种），预先估计可能的位置，随后线性查找。

B+树的优化

分为前缀压缩，后缀截断，批量插入，指针滑动。

前缀压缩指的是在一个叶子节点上，如果KEY拥有共有前缀，可以提取出来，节约存储空间。

image.png

后缀截断指的是在中间节点，不一定需要全部的数据才能做ROUTE，可能一定的头上的数据量就够了，再多的数据也没有帮助，就可以把没有帮助的部分给截断了。

image.png

image.png

批量插入指的是一个一个插入效率很低，因为需要不断做分裂。高效的做法是，等插入了很多之后，一次性，做一个B+树的重建。

image.png

指针滑动指的是，当我们要切换PAGE的时候，如果需要的PAGE在BUFFER POOL MANGER里已经有了，并且PIN住了，我们可以直接不存那个PAGE ID，而是存指向BUFFER POOL的PAGE的指针。这样就可以从内存里直接拿了。

image.png

相关文章

CMU 15445 6.B+树 + homework2
https://15445.courses.cs.cmu.edu/fall2018/slides/07-trees...
CMU 15445 7.skip list + radix tr
https://15445.courses.cs.cmu.edu/fall2018/notes/08-trees2...
CMU 15445 10. 连接
为什么我们需要连接？我们规范化关系数据库中的表，以避免不必要的信息重复。我们使用join操作来重建原始元组而不会...
CMU 15445 Project 4 实现Logging An
LAB 第一个TASK的实现目标，就是去记录LOG。但是不是每次写LOG都会直接去落盘，也是会先CACHE在一个B...
CMU 15445 15. TO + OCC + MVCC
时间戳排序（T / O）是一种乐观的并发控制协议类，其中DBMS假定事务冲突很少。 DBMS不是要求事务在允许读取...
CMU 15445 12. 并发模型
背景所有并行执行查询的DBMS都提供了以下几个好处：提高吞吐量和延迟性能。提高可用性。可能降低总体拥有成本...
CMU 15445 11. Query 优化
SQL是声明性的。这意味着用户告诉DBMS他们想要什么答案，而不是如何得到答案。因此，DBMS需要将SQL语句...
CMU 15445 8. Query plan
DBMS将SQL语句转换为查询计划。 Operator被安排在Tree上。数据从叶子流向根。树中根节点的输出是...
CMU 15445 13.并发控制理论
ACID 子性：一个事务的所有的操作要么全发生，要么全不发生一致性：如果在事务的开始，数据库的状态是一致的，那么可...
CMU 15445 Project 3 实现Lock Manag
此LAB 按照2017的要求做到后面发现因为缺少极多信息，比如API的框架，一些CONFIG的参数。我无法完成2...

网友评论

本文标题：CMU 15445 6.B+树 + homework2

本文链接：https://www.haomeiwen.com/subject/wbqjtctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|CMU 15445 6.B+树 + homework2|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！