面经 数据库(一)架构、索引

数据库架构

数据库设计

  • 程序实例

    • 存储管理
    • 缓存机制
    • SQL解析
    • 日志管理
    • 权限划分
    • 容灾机制
    • 索引管理
    • 锁管理
  • 存储(文件系统)

索引模块

官方方对索引的定义为:索引是帮助 MySQL高效获取数据的数据结构

  1. 为什么要用索引

    • 快速查询数据
    • 保证数据的唯一性
  2. 索引的优缺点

    • 优点

      • 大大加快数据检索速度
      • 创建唯一索引,保证数据库表中每行数据的唯一性
      • 加速表之间的连接
      • 减少查询中分组和排序的时间
    • 缺点

      • 需要占用物理空间
      • 对表中数据进行增加、删除和修改时索引也要更新,降低了数据维护速度
  3. 什么样的信息能成为索引

    • 主键、唯一键以及普通键等等
  4. 索引的数据结构

    • 生成索引,建立二叉查找树进行二分查找 效率 O(logn)
    • 生成索引,建立B-Tree进行查找 效率 O(logn)

      • B-Tree
      • 根节点至少包括两个孩子
      • 树中每个节点最多含有m个孩子(m>=2)
      • 除根节点和叶子节点外,其他每个节点至少有ceil(m/2)个孩子
      • 所有叶子节点都位于同一层
    • 生成索引,建立B+-Tree进行查找(主流)

      • 定义基本与B-Tree一致
      • 非叶子节点的子树指针与关键字个数相同
      • 非叶子节点仅使用索引,数据都保存在叶子节点中
      • 所有叶子节点均有一个链指针指向下一个叶子节点
      • B+-Tree更适合用来做存储引擎

        • B+树的磁盘读写代价更低
        • B+树的查询效率更加稳定
        • B+树更有利于对数据库的扫描
    • 生成索引,建立Hash结构进行查找

      • 查询效率更高
      • 缺点

        • 仅仅能满足"=","IN",不能使用范围查询
        • 无法被用来避免数据的排序操作
        • 不能利用部分索引键查询
        • 不能避免表扫码
        • 遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高
    • BitMap索引
  5. 密集索引和稀疏索引的区别

    • 密集索引文件中的每个搜索码值都对应一个索引值
    • 稀疏索引文件只为索引码的某些值建立索引项
  6. 如何定位并优化慢查询sql

    • 根据慢日志定位慢查询sql
    • 使用explain等工具分析sql
    • 修改sql或者尽量让sql走索引
  7. 联合索引的最左匹配原则的成因

    • mysql创建复合索引的规则是首先会对复合索引的最左边,也就是索引中的第一个字段进行排序,在第 一个字段排序的基础上,在对索引上第二个字段进行排序,其实就像是实现类似order by字段1,字段2这样的排序规则,那么第一个字段是绝对有序的,而第二个字段就是无序的了,因此一般情况下直接只用第二个字段判断是用不到索引的,这就是为什么mysql要强调联合索引最左匹配原则的原因
  8. 索引是建立得越多越好吗

    • 数据量小的表不需要建立索引,建立会增加额外的索引开销
    • 数据变更需要维护索引,意味着更多的索引意味着更多的维护成本
    • 更多的索引也需要跟多的存储空间
# 面经
: )