创建高性能索引

索引类似于书籍的目录,要想找到一本书的某个特定主题,需要先查找树的目录,定位对应的页码。存储引擎使用类似的方法进行数据查询,先去索引当中找到对应的值,然后根据匹配的索引找到对应的数据行。

索引对性能的影响

  • 大大减少服务器需要扫描的数据量
  • 帮助服务器避免排序和临时表
  • 将随机I/O变为顺序I/O
  • 大大提高查询速度,但是会降低写的速度、占用磁盘

索引的使用场景

  • 对于非常小的表,大部分情况下全表扫描效率更高
  • 中到大型表,索引非常有效
  • 特大型的表,建立和使用索引的代价将随之增长,可以使用分区技术来解决

索引的类型

  • 索引有很多种类型,都是实现在存储引擎层的
  • 普通索引:最基本的索引,没有任何约束限制
  • 唯一索引:与普通索引类似,但是具有唯一性索引
  • 组合索引:将多个列组合在一起创建索引,可以覆盖多个列
  • 外键索引:只有InnoDB类型的表才可以使用外键索引,保证数据的一致性、完整性和实现级联操作
  • 全文索引:只有MyISAM类型才能使用,并且只能对英文进行全文检索

注:一个表只能有一个主键索引,可以有多个唯一索引。主键索引一定是唯一索引,唯一索引不一定是主键索引。主键可以与外键构成参照完整性约束,防止数据不一致。


原则

  • 最合适索引的列是出现在WHERE字句忠的列,或连接字句忠的列,而不是出现在SELECT关键字后的列
  • 索引列的基数越大,索引的效果越好,对字符串进行索引,应该制定一个前缀长度,可以节省大量的索引空间,根据情况创建复合索引,复合索引可以提高查询效率
  • 避免创建过多索引,索引会额外占用磁盘空间,降低写操作效率
  • 主键尽可能选择较短的数据类型,可以有效减少索引的磁盘占用,提高查询效率

注意点

  • 复合索引遵循前缀原则

    key(a,b,c)

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    // 有效:

    WHERE a=1 and b=2 and c=3

    WHERE a=1 and b=2

    WHERE a=1

    // 无效:

    WHERE b=2 and c=3

    WHERE a=1 and c=3
  • like查询,%不能在前,可以使用全文索引

    1
    2
    // %在前索引无效
    WHERE name LIKE "%search_string%"
  • COLUMN IS NULL 可以使用索引

  • 如果MYSQL估计使用索引比全表扫描更慢,放弃使用索引
  • 如果OR前的列有索引,后面的没有,索引也是无效的
  • 列类型是字符串,查询时一定要给值加引号,非则索引无效

    字段 name varchar(16),需要搜索 “100”。

    1
    2
    3
    4
    5
    // 有效
    WHERE name="100"

    // 无效
    WHERE name=100