美文网首页
01-mysql基础

01-mysql基础

作者: wshsdm | 来源:发表于2022-12-20 17:20 被阅读0次

    1 null值注意

    • count数据丢失null值行
    • distinct数据丢失
      当使用count(distinct col1,col2)查询时,如果其中某一列为null,查询结果将丢失数据;
    • null不能使用比较运算符,使用isnull(列)函数、is null 、is not null
    • sum(列)如果列中包含null,返回null;解决方案
    select ifnull(sum(列),0)
    
    • null不会影响索引

    2 事务特性

    2.1 基本概念

    事务:访问和更新数据库程序执行单元,事务包含一个或多个sql语句,这些sql语句要么一起执行成功,要么一起失败;
    mysql基本结构图


    image.png

    2.2 ACID特性

    • 原子性(Atomicity)
      Inno DB存储引擎提供两种事务日志undo log和redo log,当sql对数据库修改时,inno db的undo log会记录sql执行相关信息,如果sql语句发生错误,innodb会根据undo log内做相反的操作;
    • 一致性(Consistency)
      指事务执行结束后,数据完整性没有被破坏
    • 隔离性(Isolation)
    1. 写写操作(锁机制)
    # 查看锁情况
    select * from information_schema.infodb_locks;
    # InnoDB整体状态,其中包括锁的情况
    show engine innodb status;
    # 事务A中执行
    start transaction;
    update account set balance=1000 where id=1;
    # 事务B中执行
    start transaction;
    update account set balance=2000 where id=1;
    
    1. 写读操作(MVCC)
    2. 脏读、不可重复读、幻读
    • 持久性(Durability)
      mysql数据存储在磁盘中,如果每次读取数据都经过磁盘IO则对性能影响较大,InnoDB提供了redo log是预写式日志,该缓冲包含磁盘数据页的一个映射,作为访问数据的缓冲;当向数据库写入数据时,也会先向将数据写入redo log,该缓冲写入数据,定期将缓冲中数据定期刷新到磁盘上,进行持久性操作;
      redo log是追加模式,属于顺序IO操作;
      redo log工作策略:
    1. 当提交事务时,并不将缓冲区的redo日志写入磁盘的日志文件,而是等待主线程每秒刷新;
    2. 在事务提交时将缓冲区的redo日志同步写入到磁盘,保证一定会写入成功;
    3. 在事务提交时将缓冲区的redo日志异步写入到磁盘,即不能完全保证commit时肯定会写入redo日志文件,只有这个动作

    3 MVCC

    3.1 MVCC基本概念

    MVCC(多版本并发控制),主要是为了提高数据库的发布性能(InnoDB支持事务,MyIsam不支持事务)
    同一行数据平时发生读写请求时,会上锁阻塞;MVCC使用更好的方式处理读写请求,做到读写请求时不用加锁;
    这里的读指的是快照读,而不是当前读,当前读是一种加锁操作,是悲观锁;

    • 当前读
      它读取数据库记录,都是当前最新的版本,会对当前读取的数据进行加锁,防止其他事务修改数据,是悲观锁的一种操作;
      当前读的操作有:
    1. select lock in share mode(共享锁)
    2. select for update(排它锁)
    3. update(排它锁)
    4. insert(排它锁)
    5. delete(排它锁)
    6. 串行化事务隔离级别
    • 快照读
      改读取方式是基于MVCC,快照读到的数据不一定是当前最新的数据,有可能是之前历史版本的数据;
      快照读包括
    1. 不加锁的select操作(注:事务级别不是串行化)

    3.2 数据库四种隔离级别

    隔离性是通过(锁和MVCC实现的)

    隔离级别 脏读 不可重复读 幻读
    读未提交(read-uncommitted)
    读提交(read-committed)
    可重读(repeatable-read)
    可串行化(serializable)

    1、脏读:
    又称无效数据的读出,是指在数据库访问中,事务T1将某一值修改但是还未提交,然后事务T2读取该值,此后T1因为某种原因撤销对该值的修改并提交,这就导致了T2所读取到的数据是无效的,值得注意的是,脏读一般是针对于update操作的。

    2、不可重复读:
    是指在数据库访问中,一个事务范围内两个相同的查询却返回了不同数据。在一个事务内,多次读同一个数据。在这个事务还没有结束时,另一个事务也访问该同一数据并修改数据。那么,在第一个事务的两次读数据之间。由于另一个事务的修改,那么第一个事务两次读到的数据可能不一样,这样就发生了在一个事务内两次读到的数据是不一样的,因此称为不可重复读,即原始读取不可重复。

    3,幻读:
    事务A 按照一定条件进行数据读取, 期间事务B 插入了相同搜索条件的新数据,事务A再次按照原先条件进行读取时,发现了事务B 新插入的数据称为幻读。

    不可重复读侧重于修改,幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行,解决幻读需要锁表
    1)read-uncommitted 读未提交:

    在该级别,所有的事务都可以看到其他未提交事务的执行结果,本隔离级别很少用于实际应用,因为它的性能不比其他级别好多少。读取未提交的数据,也称之为脏读。

    2)read-committed 读提交内容:

    这是大多数数据库系统的默认隔离级别(但不是MYSQL默认的),它满足了隔离的简单定义:一个事务只能看见已提交事务所做的改变。也支持所谓的不可重复读。

    3)repeatable-read 可重读:

    是MYSQL默认的,确保统一事务的多个实例在并发读取数据时,会看到同样的数据行。

    4)serializable 可串行化:

    这是最高的隔离级别,他通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简而言之,他是在每个读的数据行上加上共享锁。在这个级别可能导致大量的超时现象和锁竞争。

    3.3 read-committed 读提交内容和repeatable-read 可重读的快照读使用MVCC

    对于表中的相同记录行包括事务ID(trx_id,自增)、回滚指针(roll pointer);对于同一条数据的修改的历史记录存储到undo日志中,并通过回滚指针指向上一次修改的记录,形成版本链;

    • 确定查询记录版本的readView对象
    m_ids 表示在生成ReadView时当前系统中活跃的读写事务的“事务ID”列表
    min_trx id 表示在生成“ReadView”时当前系统中活跃的读写事务中最小的“事务ID”
    max_trx id 表示生成“ReadView”时系统中应该分配给下一个事务的“ID”值
    creator_trx id 表示生成该“ReadView”的事务的“事务ID”
    • ReadView如何判断版本链哪个版本可用
      trx id==creator_trx id:可以访问这个版本
      trx id<min_trx_id: 可以访问这个版本
      trx_id>max_trx_id: 不可以访问这个版本
      min_trx_id<=trx_id<=max_trx_id: 如果trx_id在m_ids中是不可以访问这个版本,反之可以

    4 MySQL索引

    4.1 索引失效原理

    联合索引,底层使用B+树存储(左前缀法则、大于号右侧失效、like会失效、or失效、<>失效、in失效)
    联合索引在底层使用B+树存储时,分支的每一个节点存储多个值(最左侧值有序,其他值在最左侧值相等情况下有序),如果不使用最左前缀法则不能利用B+树查找数据;

    4.2 索引查询数据流程

    1. MyIsam和InnoDB区别
    对比项 MyIsam InnoDB
    事务 不支持 支持
    外键 不支持 支持
    索引 非聚簇,支持FullText类型全文索引 聚簇,不支持FULLTEXT类型全文索引
    锁粒度 表锁 行锁
    存储结构 .frm表定义文件、.MYD数据文件、.MYI索引文件 frm表定义文件、Idb文件数据和索引文件
    1. 聚簇和非聚簇索引
      聚簇索引(InnoDB)
      将数据存储于索引放到一块,索引结构的叶子节点保存了行数据;
      表数据按照索引的顺序来存储,也就是说索引项的顺序与表中记录的物理顺序一致;
      InnoDB中,在聚簇索引之上创建的索引称为辅助索引,像符合索引、前缀索引、唯一索引等;
    • 聚簇索引默认是主键
    • 如果表没有定义主键,InnoDB会选择一个唯一的非空索引代替
    • 如果没有这样的索引,InnoDB会在内部生成一个名为GEN_CLUST_INDEX的隐式的聚簇索引;
      非聚簇索引(MyISAM)
      将数据与索引分开存储,表数据存储顺序与索引顺序无关;

    4.3 MyISAM索引查询数据过程

    MyIsam的B+树叶子节点存储记录地址;
    InnoDB的聚簇索引,B+树叶子节点存储记录;
    InnoDB的辅助索引(如复合索引),B+树叶子节点存储key和主键值;

    • 未使用索引查询
    select sql_no_cache * from 表 where 列1='值' and ...
    

    4.4 索引优化

    1. 最左前缀法则
      如果建立的是复合索引,索引的顺序要建立时的顺序,既从左到右,如 a->b->c
      无效索引举例:
    a->c, a有效,c无效
    b->c: b、c都无效
    c:c无效
    
    1. 不要对索引做如下处理,如下操作会使索引失效
    • 运算符号,如+,-,*,/,!=,<>,is null, is not null,or
    • 函数,如sum(),round()
    • 手动、自动类型转换,如id="1",本来是数字,写成了字符串
    1. 索引不要放在范围查询右边
      如复合索引:a->b->c,当 where a='' and b>10 and 3='',这时只用到a和b,c用不到索引,因为在范围之后索引都失效(和B+树结构有关)
    2. 减少select *的使用
      尽量使用覆盖索引,如select查询字段和where中使用的字段一致;
    3. like模糊搜索
      失效情况
    like '%xx'
    或
    like '%xx%'
    

    解决方案
    使用覆盖索引

    select name from table where name like '%张%'
    或
    like '张%'
    
    1. order by优化
      当查询语句使用order by进行排序时,如果没有使用索引进行排序,会出现filesort(文件内排序,这种情况记录没有在内存中排序,而是会开辟一块空间进行排序,性能非常慢),这种情况在数据量大活并发高的时候,会出现性能问题
      优化
    可以使用覆盖索引,如
    select col1 from tab order by col1;
    
    order by字段不是索引字段
    order by字段是索引字段,但是select中没有覆盖索引;
    order by中同时存在ASC和DESC
    order by多个字段排序排序时,不是按照索引顺序进行order by,既不是按照最左前缀法则
    

    5 锁实现

    • or导致索引失效,由行锁升级为表锁
    set autocommit=0;
    update tab set b='a4' where a=1 or a=2;
    # 
    
    • 间隙锁
    范围查询形成间隙锁;
    
    • 查询锁
    show status like 'innodb_row_lock%';
    

    相关文章

      网友评论

          本文标题:01-mysql基础

          本文链接:https://www.haomeiwen.com/subject/jhvuqdtx.html