原创首发

Sql调优技巧（结合案例）

拉大锯发表于 2024-01-25 12:22 209

sql 调优 mysql

Sql调优技巧

SQL调优是指针对数据库查询性能进行优化的过程，以提高数据检索速度、降低响应时间并减轻数据库服务器的压力。以下是SQL调优的一些重要技巧：

索引优化：
- 在频繁出现在 WHERE 子句、连接条件和 ORDER BY 子句中的列上创建索引，特别是主键和外键。
- 对于联合索引，考虑查询中使用的列顺序以及最左前缀原则。
- 定期检查并维护索引，删除不再被使用的索引，监控重复和冗余索引。
- 注意索引的选择性，即唯一值越多的列越适合做索引。
避免全表扫描：
- 避免在没有适当索引的情况下执行全表扫描，尤其是在大表上。
- 使用覆盖索引（索引包含查询所需的所有列），这样可以直接从索引中获取结果，无需回表。
合理书写WHERE条件：
- 避免在索引列上使用否定条件（如 != 或 NOT IN），这可能导致无法利用索引。
- 减少使用 OR 连接条件，因为这可能使优化器难以选择最优索引。
- 对于范围查询（如 BETWEEN 或 < >），后面的条件可能无法充分利用索引。
函数与计算优化：
- 不要在索引列上直接使用函数或表达式，这将阻止优化器使用索引。
- 如果可能，尽量在应用程序层面完成计算，然后将计算结果作为参数传入查询。
JOIN优化：
- 确保连接条件上有合适的索引，尤其是外键关联。
- 尽量减少不必要的JOIN操作，只连接真正需要的数据表。
- 分析JOIN的执行计划，确定是否采用了正确的JOIN策略（如嵌套循环、哈希JOIN、排序合并JOIN等）。
分页查询优化：
- 对于大量数据的分页查询，使用偏移量可能会效率低下，可以考虑基于ID区间或者记录最后更新时间来优化分页。
预编译与批处理：
- 使用PreparedStatement进行参数化查询，能带来预编译的性能提升，并且防止SQL注入。
- 批量执行SQL语句，减少数据库交互次数。
查询语句重构：
- 避免在事务中使用SELECT COUNT(*) FROM TABLE; 而是在插入、删除时维护一个计数器或者使用触发器统计。
- 将复杂的查询分解成简单的查询或者临时表/视图。
数据库配置调优：
- 调整数据库系统的内存分配、缓存大小、IO设置、并行度等相关参数。
- 监控数据库性能指标，如缓冲池命中率、锁竞争情况、磁盘I/O等。
应用层优化：
- 尽量减少查询返回的数据量，只取必要的列，避免使用SELECT *。
- 合理利用缓存技术，对于不常改变但查询频繁的数据，可以在应用层缓存结果。
查询执行计划分析：
- 使用数据库提供的工具查看查询执行计划，理解数据库是如何执行SQL语句的，并据此进行针对性优化。

每个数据库管理系统都有各自的特性和最佳实践，在调优时务必结合具体数据库的特点来进行。同时，定期审计SQL语句，结合性能监控数据，持续不断地对SQL进行优化。

补充

当然，SQL调优还可以涉及更多深入的技术和策略，这里补充几个实例说明：

避免在关联字段上进行类型转换：
- 案例：假设有一个订单表(order)和客户表(customer)，关联字段是客户ID，但在order表中存储的是字符串类型，而customer表中是整型。如果在JOIN时不做类型转换，数据库引擎可能无法使用索引。
```
SELECT * FROM orders o JOIN customers c ON CAST(o.customer_id AS INT) = c.id;
```
优化方案：在应用程序层确保数据一致性，或在数据库层修改表结构，使得关联字段类型统一。

子查询改写为JOIN：

案例：一个查询需要找出销售最多的商品名称。

SELECT product_name 
FROM products 
WHERE product_id IN (SELECT product_id FROM sales GROUP BY product_id ORDER BY SUM(quantity) DESC LIMIT 1);

优化方案：将子查询改写为JOIN，减少中间结果集的生成，提高查询效率。

SELECT p.product_name 
FROM products p 
JOIN (
   SELECT product_id, SUM(quantity) as total_quantity
   FROM sales 
   GROUP BY product_id 
   ORDER BY total_quantity DESC 
   LIMIT 1
) s ON p.product_id = s.product_id;

分区表的应用：
- 对于大型的历史表，可以按时间、地区等维度进行分区，提高查询和维护效率。
- 案例：一个大型的日志表，可以根据日期进行分区。
```
CREATE TABLE logs (
   id INT PRIMARY KEY,
   log_time TIMESTAMP,
   ...
) PARTITION BY RANGE (TO_DAYS(log_time)) (
   PARTITION p0 VALUES LESS THAN (TO_DAYS('2021-01-01')),
   PARTITION p1 VALUES LESS THAN (TO_DAYS('2021-02-01')),
   ...
);
```
这样当查询指定时间段的日志时，数据库只需要扫描对应的分区，而不是整个大表。
EXPLAIN 和 EXPLAIN ANALYZE 的使用：
- MySQL、PostgreSQL等数据库支持EXPLAIN或EXPLAIN ANALYZE来查看SQL查询的执行计划，帮助我们了解数据库如何执行SQL，识别潜在瓶颈。
- 案例：对一个复杂的查询使用EXPLAIN分析，发现MySQL选择了错误的索引，可以通过添加FORCE INDEX强制使用期望的索引。

以上案例展示了SQL调优的一些实战技巧，实际上根据数据库的特性和应用场景，还有很多其他优化策略，如查询重写、物化视图、延迟关联、读写分离、分库分表等等。

案例

下面以MySQL为例，进一步给出两个具体的SQL优化案例：

案例1：避免全表扫描与索引优化

-- 原始未优化的查询，可能导致全表扫描
SELECT * FROM users WHERE last_name LIKE '%smith%';

-- 优化方案：由于LIKE模糊查询以%开头，MySQL无法有效利用索引
-- 如果该场景频繁出现且数据量较大，可以考虑创建全文索引（FULLTEXT）或改进查询条件
CREATE FULLTEXT INDEX idx_users_lastname ON users(last_name);

-- 使用全文索引进行查询
SELECT * FROM users WHERE MATCH(last_name) AGAINST ('smith' IN BOOLEAN MODE);

-- 或者，如果能够精确匹配一部分值，比如姓氏的首字母，可以创建并使用前缀索引
ALTER TABLE users ADD INDEX idx_users_lastname_prefix (last_name(5)); -- 假设姓氏长度足够区分，只索引前5个字符
SELECT * FROM users WHERE last_name LIKE 'smith%';

案例2：避免排序操作带来的开销

-- 原始查询，分页查询时常见的效率低下问题
SELECT * FROM orders ORDER BY order_date DESC LIMIT 100000, 50;

-- 优化方案：通过预先排序和记录最后一个显示项的排序值
-- 下面的查询首先找出“分页边界”，然后与orders表做JOIN，从而减少大量行的排序操作
SELECT o.*
FROM orders o
JOIN (
    SELECT order_id
    FROM orders
    ORDER BY order_date DESC
    LIMIT 100000, 50
) t ON o.order_id = t.order_id
WHERE o.order_date IS NOT NULL; -- 假设order_date非空，并且有索引

-- 注意：为了提高这个查询的速度，order_date列必须要有索引，否则排序依然会很慢

上述例子中，第一个案例关注了索引的选择和使用，第二个案例则处理了分页查询时的排序性能问题。在实际SQL优化工作中，往往需要综合运用多种优化策略，包括但不限于选择合适的索引、合理重构查询语句、利用覆盖索引、减少临时表与文件排序等。同时，也需密切关注业务逻辑和数据分布情况，适时调整数据库架构和设计。

本文由拉大锯原创发布于阳光沙滩，未经作者授权，禁止转载

0/240