食者,国之宝也;兵者,国之爪也——《墨子·05章 七患》
数据库架构
数据库设计
程序实例
- 存储管理
- 缓存机制
- SQL解析
- 日志管理
- 权限划分
- 容灾机制
- 索引管理
- 锁管理
- 存储(文件系统)
索引模块
官方方对索引的定义为:索引是帮助 MySQL高效获取数据的数据结构
为什么要用索引
- 快速查询数据
- 保证数据的唯一性
索引的优缺点
优点
- 大大加快数据检索速度
- 创建唯一索引,保证数据库表中每行数据的唯一性
- 加速表之间的连接
- 减少查询中分组和排序的时间
缺点
- 需要占用物理空间
- 对表中数据进行增加、删除和修改时索引也要更新,降低了数据维护速度
什么样的信息能成为索引
- 主键、唯一键以及普通键等等
索引的数据结构
- 生成索引,建立二叉查找树进行二分查找 效率 O(logn)
生成索引,建立B-Tree进行查找 效率 O(logn)
- B-Tree
- 根节点至少包括两个孩子
- 树中每个节点最多含有m个孩子(m>=2)
- 除根节点和叶子节点外,其他每个节点至少有ceil(m/2)个孩子
- 所有叶子节点都位于同一层
生成索引,建立B+-Tree进行查找(主流)
- 定义基本与B-Tree一致
- 非叶子节点的子树指针与关键字个数相同
- 非叶子节点仅使用索引,数据都保存在叶子节点中
- 所有叶子节点均有一个链指针指向下一个叶子节点
B+-Tree更适合用来做存储引擎
- B+树的磁盘读写代价更低
- B+树的查询效率更加稳定
- B+树更有利于对数据库的扫描
生成索引,建立Hash结构进行查找
- 查询效率更高
缺点
- 仅仅能满足"=","IN",不能使用范围查询
- 无法被用来避免数据的排序操作
- 不能利用部分索引键查询
- 不能避免表扫码
- 遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高
- BitMap索引
密集索引和稀疏索引的区别
- 密集索引文件中的每个搜索码值都对应一个索引值
- 稀疏索引文件只为索引码的某些值建立索引项
如何定位并优化慢查询sql
- 根据慢日志定位慢查询sql
- 使用explain等工具分析sql
- 修改sql或者尽量让sql走索引
联合索引的最左匹配原则的成因
- mysql创建复合索引的规则是首先会对复合索引的最左边,也就是索引中的第一个字段进行排序,在第 一个字段排序的基础上,在对索引上第二个字段进行排序,其实就像是实现类似order by字段1,字段2这样的排序规则,那么第一个字段是绝对有序的,而第二个字段就是无序的了,因此一般情况下直接只用第二个字段判断是用不到索引的,这就是为什么mysql要强调联合索引最左匹配原则的原因
索引是建立得越多越好吗
- 数据量小的表不需要建立索引,建立会增加额外的索引开销
- 数据变更需要维护索引,意味着更多的索引意味着更多的维护成本
- 更多的索引也需要跟多的存储空间