title | aliases | |||||
---|---|---|---|---|---|---|
系统变量 |
|
TiDB 系统变量的行为与 MySQL 相似,变量的作用范围可以是会话级别有效 (Session Scope) 或全局范围有效 (Global Scope)。其中:
- 对
SESSION
作用域变量的更改,设置后只影响当前会话。 - 对
GLOBAL
作用域变量的更改,设置后立即生效。如果该变量也有SESSION
作用域,已经连接的所有会话 (包括当前会话) 将继续使用会话当前的SESSION
变量值。 - 要设置变量值,可使用
SET
语句。
# 以下两个语句等价地改变一个 Session 变量
SET tidb_distsql_scan_concurrency = 10;
SET SESSION tidb_distsql_scan_concurrency = 10;
# 以下两个语句等价地改变一个 Global 变量
SET @@global.tidb_distsql_scan_concurrency = 10;
SET GLOBAL tidb_distsql_scan_concurrency = 10;
注意:
部分
GLOBAL
作用域的变量会持久化到 TiDB 集群中。文档中的变量有一个“是否持久化到集群”的说明,可以为“是”或者“否”。
- 对于持久化到集群的变量,当该全局变量被修改后,会通知所有 TiDB 服务器刷新其系统变量缓存。在集群中增加一个新的 TiDB 服务器时,或者重启现存的 TiDB 服务器时,都将自动使用该持久化变量。
- 对于不持久化到集群的变量,对变量的修改只对当前连接的 TiDB 实例生效。如果需要保留设置过的值,需要在
tidb.toml
配置文件中声明。此外,由于应用和连接器通常需要读取 MySQL 变量,为了兼容这一需求,在 TiDB 中,部分 MySQL 的变量既可读取也可设置。例如,尽管 JDBC 连接器不依赖于查询缓存 (query cache) 的行为,但仍然可以读取和设置查询缓存。
注意:
变量取较大值并不总会带来更好的性能。由于大部分变量对单个连接生效,设置变量时,还应考虑正在执行语句的并发连接数量。
确定安全值时,应考虑变量的单位:
- 如果单位为线程,安全值通常取决于 CPU 核的数量。
- 如果单位为字节,安全值通常小于系统内存的总量。
- 如果单位为时间,单位可能为秒或毫秒。
单位相同的多个变量可能会争夺同一组资源。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 是否允许在
INSERT
语句中显式指定含有AUTO_RANDOM
属性的列的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1
- 范围:
[1, 65535]
- 控制
AUTO_INCREMENT
自增值字段的自增步长。该变量常与auto_increment_offset
一起使用。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1
- 范围:
[1, 65535]
- 控制
AUTO_INCREMENT
自增值字段的初始值。该变量常与auto_increment_increment
一起使用。示例如下:
mysql> CREATE TABLE t1 (a int not null primary key auto_increment);
Query OK, 0 rows affected (0.10 sec)
mysql> set auto_increment_offset=1;
Query OK, 0 rows affected (0.00 sec)
mysql> set auto_increment_increment=3;
Query OK, 0 rows affected (0.00 sec)
mysql> INSERT INTO t1 VALUES (),(),(),();
Query OK, 4 rows affected (0.04 sec)
Records: 4 Duplicates: 0 Warnings: 0
mysql> SELECT * FROM t1;
+----+
| a |
+----+
| 1 |
| 4 |
| 7 |
| 10 |
+----+
4 rows in set (0.00 sec)
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 用于设置在非显式事务时是否自动提交事务。更多信息,请参见事务概述。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
utf8mb4
- 这个变量表示从客户端发出的数据所用的字符集。有关更多 TiDB 支持的字符集和排序规则,参阅字符集和排序规则文档。如果需要更改字符集,建议使用
SET NAMES
语句。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
utf8mb4
- 若没有为字符串常量指定字符集,该变量表示这些字符串常量所使用的字符集。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
utf8mb4
- 该变量表示当前默认在用数据库的字符集,不建议设置该变量。选择新的默认数据库后,服务器会更改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
utf8mb4
- 该变量表示数据发送至客户端时所使用的字符集。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
utf8mb4
- 当
CREATE SCHEMA
中没有指定字符集时,该变量表示这些新建的表结构所使用的字符集。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1000
- 范围:
[0, 4294967295]
- 这个变量用于控制公共表表达式的最大递归深度。
- 作用域:NONE
- 默认值:/tmp/tidb
- 这个变量表示数据存储的位置,位置可以是本地路径。如果数据存储在 TiKV 上,则可以是指向 PD 服务器的路径。
- 如果变量值的格式为
ip_address:port
,表示 TiDB 在启动时连接到的 PD 服务器。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
300
- 单位:毫秒
- 耗时超过该阈值的 DDL 操作会被输出到日志。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
mysql_native_password
- 可选值:
mysql_native_password
,caching_sha2_password
- 服务器和客户端建立连接时,这个变量用于设置服务器对外通告的默认身份验证方式。如要了解该变量的其他可选值,参见可用的身份验证插件。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 为保持兼容,TiDB 对外键检查返回
OFF
。
- 作用域:NONE
- 默认值:(系统主机名)
- 这个变量一个只读变量,表示 TiDB server 的主机名。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:""
- 用户首次连接到 TiDB 服务器时,
init_connect
特性允许 TiDB 自动执行一条或多条 SQL 语句。如果你有CONNECTION_ADMIN
或者SUPER
权限,这些 SQL 语句将不会被自动执行。如果这些语句执行报错,你的用户连接将被终止。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
50
- 范围:
[1, 3600]
- 单位:秒
- 悲观事务语句等锁时间。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
28800
- 范围:
[1, 31536000]
- 单位:秒
- 该变量表示交互式用户会话的空闲超时。交互式用户会话是指使用
CLIENT_INTERACTIVE
选项调用mysql_real_connect()
API 建立的会话(例如:MySQL shell 客户端)。该变量与 MySQL 完全兼容。
- 作用域:SESSION
- 默认值:
OFF
- 该变量用来显示上一条执行的语句所使用的执行计划是否来自 binding 的执行计划。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来显示上一个
execute
语句所使用的执行计划是不是直接从 plan cache 中取出来的。
- 作用域:NONE
- 默认值:
Apache License 2.0
- 这个变量表示 TiDB 服务器的安装许可证。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 范围:
[0, 2147483647]
- 单位:毫秒
- 语句最长执行时间。默认值 (0) 表示无限制。
注意:
max_execution_time
目前对所有类型的语句生效,并非只对SELECT
语句生效,与 MySQL 不同(只对SELECT
语句生效)。实际精度在 100ms 级别,而非更准确的毫秒级别。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 类型:整数
- 默认值:
-1
- 范围:
[-1, 1048576]
- 指定一个会话中
PREPARE
语句的最大数量。 - 值为
-1
时表示不对会话中的PREPARE
语句数量进行限制。 - 如果将变量值设为超过上限
1048576
,则使用上限值1048576
:
mysql> SET GLOBAL max_prepared_stmt_count = 1048577;
Query OK, 0 rows affected, 1 warning (0.01 sec)
mysql> SHOW WARNINGS;
+---------+------+--------------------------------------------------------------+
| Level | Code | Message |
+---------+------+--------------------------------------------------------------+
| Warning | 1292 | Truncated incorrect max_prepared_stmt_count value: '1048577' |
+---------+------+--------------------------------------------------------------+
1 row in set (0.00 sec)
mysql> SHOW GLOBAL VARIABLES LIKE 'max_prepared_stmt_count';
+-------------------------+---------+
| Variable_name | Value |
+-------------------------+---------+
| max_prepared_stmt_count | 1048576 |
+-------------------------+---------+
1 row in set (0.00 sec)
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:""
- 指定加载插件的目录。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:""
- 指定 TiDB 启动时加载的插件,多个插件之间用逗号(,)分隔。
- 作用域:NONE
- 默认值:
4000
- 范围:
[0, 65535]
- 使用 MySQL 协议时 tidb-server 监听的端口。
- 作用域:SESSION
- 默认值:
0
- 范围:
[0, 2147483647]
- 该变量用于为 SQL 函数
RAND()
中使用的随机值生成器添加种子。 - 该变量的行为与 MySQL 兼容。
- 作用域:SESSION
- 默认值:
0
- 范围:
[0, 2147483647]
- 该变量用于为 SQL 函数
RAND()
中使用的随机值生成器添加种子。 - 该变量的行为与 MySQL 兼容。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 该变量控制是否所有 TiDB 的连接都在本地 socket 上进行通信,或使用 TLS。详情见为 TiDB 客户端服务端间通信开启加密传输。
- 该变量设置为
ON
时,必须使用开启 TLS 的会话连接到 TiDB,防止在 TLS 配置不正确时出现锁定的情况。 - 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
security.require-secure-transport
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 该变量控制
tidb-server
实例是否将主机名作为连接握手的一部分来解析。 - 当 DNS 不可靠时,可以启用该变量来提高网络性能。
注意:
当
skip_name_resolve
设置为ON
时,身份信息中包含主机名的用户将无法登录服务器。例如:CREATE USER 'appuser'@'apphost' IDENTIFIED BY 'app-password';该示例中,建议将
apphost
替换为 IP 地址或通配符(%
)。
- 作用域:NONE
- 默认值:""
- 使用 MySQL 协议时,tidb-server 所监听的本地 unix 套接字文件。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
- 这个变量控制许多 MySQL 兼容行为。详情见 SQL 模式。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
18446744073709551615
- 范围:
[0, 18446744073709551615]
SELECT
语句返回的最大行数。
- 作用域:NONE
- 默认值:(随系统)
- 该变量显示首次引导启动 TiDB 时的系统时区。另请参阅
time_zone
。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
1
-
范围:
[0, 2]
-
这个变量用于控制 TiDB 向 TiFlash 发送 coprocessor 请求的方式,有以下几种取值:
- 0:从不批量发送请求
- 1:aggregation 和 join 的请求会进行批量发送
- 2:所有的 cop 请求都会批量发送
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:""
- 这个变量表示将 TiKV 作为备用存储引擎的存储引擎列表。当该列表中的存储引擎发生故障导致 SQL 语句执行失败时,TiDB 会使用 TiKV 作为存储引擎再次执行该 SQL 语句。目前支持设置该变量为 "" 或者 "tiflash"。如果设置该变量为 "tiflash",当 TiFlash 返回超时错误(对应的错误码为 ErrTiFlashServerTimeout)时,TiDB 会使用 TiKV 作为存储引擎再次执行该 SQL 语句。
- 作用域:NONE
- 默认值:
lower, md5, reverse, tidb_shard, upper, vitess_hash
- 这个变量用于显示创建表达式索引所允许使用的函数。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否使用 TiFlash 的 MPP 模式执行查询,可以设置的值包括:
- 0 或 OFF,代表从不使用 MPP 模式
- 1 或 ON,代表由优化器根据代价估算选择是否使用 MPP 模式(默认)
MPP 是 TiFlash 引擎提供的分布式计算框架,允许节点之间的数据交换并提供高性能、高吞吐的 SQL 算法。MPP 模式选择的详细说明参见控制是否选择 MPP 模式。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来控制是否允许通过
ALTER TABLE MODIFY
或ALTER TABLE CHANGE
来移除某个列的AUTO_INCREMENT
属性。默认 (OFF
) 为不允许。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
2
- 范围:
[1, 2]
- 这个变量用于控制 TiDB 收集统计信息的行为。
- 在 v5.3.0 及之后的版本中,该变量的默认值为
2
,具体可参照统计信息简介文档。如果从 v5.3.0 之前版本的集群升级至 v5.3.0 及之后的版本,tidb_analyze_version
的默认值不发生变化。
-
作用域:GLOBAL
-
是否持久化到集群:是
-
默认值:
23:59 +0000
-
这个变量用来设置一天中允许自动 ANALYZE 更新统计信息的结束时间。例如,只允许在凌晨 1:00 至 3:00 之间自动更新统计信息,可以设置如下:
tidb_auto_analyze_start_time='01:00 +0000'
tidb_auto_analyze_end_time='03:00 +0000'
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0.5
- 这个变量用来设置 TiDB 在后台自动执行
ANALYZE TABLE
更新统计信息的阈值。0.5
指的是当表中超过 50% 的行被修改时,触发自动 ANALYZE 更新。可以指定tidb_auto_analyze_start_time
和tidb_auto_analyze_end_time
来限制自动 ANALYZE 的时间
注意:
当系统变量
tidb_enable_auto_analyze
设置为ON
时,TiDB 才会触发auto_analyze
。
-
作用域:GLOBAL
-
是否持久化到集群:是
-
默认值:
00:00 +0000
-
这个变量用来设置一天中允许自动 ANALYZE 更新统计信息的开始时间。例如,只允许在凌晨 1:00 至 3:00 之间自动更新统计信息,可以设置如下:
tidb_auto_analyze_start_time='01:00 +0000'
tidb_auto_analyze_end_time='03:00 +0000'
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
43200
- 范围:
[0, 2147483647]
- 单位:秒
- 这个变量用于指定自动 ANALYZE 的最大执行时间。当执行时间超出指定的时间时,自动 ANALYZE 会被终止。当该变量值为 0 时,自动 ANALYZE 没有最大执行时间的限制。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
10
- 范围:
[1, 2147483647]
- 这个变量用来设置读请求遇到锁的 backoff 时间。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
2
-
范围:
[0, 2147483647]
-
这个变量用来给 TiDB 的
backoff
最大时间增加权重,即内部遇到网络或其他组件 (TiKV, PD) 故障时,发送重试请求的最大重试时间。可以通过这个变量来调整最大重试时间,最小值为 1。例如,TiDB 向 PD 取 TSO 的基础超时时间是 15 秒,当
tidb_backoff_weight = 2
时,取 TSO 的最大超时时间为:基础时间 * 2 等于 30 秒。在网络环境较差的情况下,适当增大该变量值可以有效缓解因为超时而向应用端报错的情况;而如果应用端希望更快地接到报错信息,则应该尽量减小该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
4000
- 范围:
[0, 2147483647]
- 使用
ALTER DATABASE SET TIFLASH REPLICA
语句为 TiFlash 添加副本时,能容许的不可用表的个数上限。如果超过该上限,则会停止或者以非常慢的速度为库中的剩余表设置 TiFlash 副本。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
10240
- 范围:
[0, 9223372036854775807]
- 单位为行数。如果 join 的对象为子查询,优化器无法估计子查询结果集大小,在这种情况下通过结果集行数判断。如果子查询的行数估计值小于该变量,则选择 Broadcast Hash Join 算法。否则选择 Shuffled Hash Join 算法。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
104857600
(100 MiB) - 范围:
[0, 9223372036854775807]
- 单位:字节
- 如果表大小(字节数)小于该值,则选择 Broadcast Hash Join 算法。否则选择 Shuffled Hash Join 算法。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
4
- 这个变量用来设置 ANALYZE 语句执行时并发度。
- 当这个变量被设置得更大时,会对其它的查询语句执行性能产生一定影响。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制是否开启自动捕获绑定功能。该功能依赖 Statement Summary,因此在使用自动绑定之前需打开 Statement Summary 开关。
- 开启该功能后会定期遍历一次 Statement Summary 中的历史 SQL 语句,并为至少出现两次的 SQL 语句自动创建绑定。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
ON
- 设置该变量为
ON
可强制只存储基本多文种平面 (BMP) 编码区段内的utf8
字符值。若要存储 BMP 区段外的utf8
值,推荐使用utf8mb4
字符集。 - 早期版本的 TiDB 中 (v2.1.x),
utf8
检查更为宽松。如果你的 TiDB 集群是从早期版本升级的,推荐关闭该变量,详情参阅升级与升级后常见问题。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
128
- 范围:
[1, 10000]
- 在单个事务的提交阶段,用于执行提交操作相关请求的 goroutine 数量。
- 若提交的事务过大,事务提交时的流控队列等待耗时可能会过长。此时,可以通过调大该配置项来加速提交。
- 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
performance.committer-concurrency
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
- 作用域:SESSION
- 默认值:
4
- 这个变量用来设置
ADMIN CHECKSUM TABLE
语句执行时扫描索引的并发度。当这个变量被设置得更大时,会对其它的查询语句执行性能产生一定影响。
- 作用域:SESSION
- 默认值:""
- 这个变量是一个只读变量,用来获取当前 TiDB Server 的配置信息。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
OFF
-
该变量仅适用于乐观事务模型。当这个变量设置为
OFF
时,唯一索引的重复值检查会被推迟到事务提交时才进行。这有助于提高性能,但对于某些应用,可能导致非预期的行为。详情见约束。-
乐观事务模型下将
tidb_constraint_check_in_place
设置为 0:{{< copyable "sql" >}}
create table t (i int key); insert into t values (1); begin optimistic; insert into t values (1);
Query OK, 1 row affected
{{< copyable "sql" >}}
tidb> commit; -- 事务提交时才检查
ERROR 1062 : Duplicate entry '1' for key 'PRIMARY'
-
乐观事务模型下将
tidb_constraint_check_in_place
设置为 1:{{< copyable "sql" >}}
set @@tidb_constraint_check_in_place=1; begin optimistic; insert into t values (1);
ERROR 1062 : Duplicate entry '1' for key 'PRIMARY'
-
悲观事务模式中,始终默认执行约束检查。
警告:
- 当前 Cost Model Version 2 为实验特性,不建议在生产环境中使用。
- 切换代价模型版本可能会引起查询计划的变动。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1
- 可选值:
[1, 2]
- TiDB v6.2.0 引入了代价模型 Cost Model Version 2,在内部测试中比此前版本的代价模型更加准确。
- 通过将
tidb_cost_model_version
设置为2
可以启用 Cost Model Version 2 代价模型,设置为1
则继续使用 Cost Model Version 1 代价模型。 - 代价模型会影响优化器对计划的选择,具体可见代价模型。
- 作用域:SESSION
- 默认值:
0
- 这个变量是一个只读变量,用来获取当前事务的时间戳。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
512
- 范围:
[0, 9223372036854775807]
- 这个变量用来控制 DDL 操作失败重试的次数。失败重试次数超过该参数的值后,会取消出错的 DDL 操作。
-
作用域:GLOBAL
-
是否持久化到集群:是
-
默认值:
256
-
范围:
[32, 10240]
-
这个变量用来设置 DDL 操作
re-organize
阶段的 batch size。比如ADD INDEX
操作,需要回填索引数据,通过并发tidb_ddl_reorg_worker_cnt
个 worker 一起回填数据,每个 worker 以 batch 为单位进行回填。- 如果
ADD INDEX
操作时有较多UPDATE
操作或者REPLACE
等更新操作,batch size 越大,事务冲突的概率也会越大,此时建议调小 batch size 的值,最小值是 32。 - 在没有事务冲突的情况下,batch size 可设为较大值(需要参考 worker 数量,见线上负载与
ADD INDEX
相互影响测试),最大值是 10240,这样回填数据的速度更快,但是 TiKV 的写入压力也会变大。
- 如果
- 作用域:SESSION
- 默认值:PRIORITY_LOW
- 这个变量用来设置
ADD INDEX
操作re-organize
阶段的执行优先级,可设置为PRIORITY_LOW
/PRIORITY_NORMAL
/PRIORITY_HIGH
。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
4
- 范围:
[1, 256]
- 这个变量用来设置 DDL 操作
re-organize
阶段的并发度。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
0.8
- 范围:
[0, 1]
- 这个变量用来设置过滤条件中的
like
、rlike
、regexp
函数在行数估算时的默认选择率,以及是否对这些函数启用 TopN 辅助估算。 - TiDB 总是会尝试利用统计信息对过滤条件中的
like
进行估算,但是当like
匹配的字符串太复杂时,或者面对rlike
或regexp
时,往往无法充分利用统计信息,转而使用0.8
作为选择率,造成行数估算的误差较大。 - 该变量可以用于修改这个行为,当变量被设为
0
以外的值时,会使用变量的值而不是默认的0.8
作为选择率。 - 如果将该变量的值设为
0
,TiDB 在对上述三个函数进行行数估算时,会尝试利用统计信息中的 TopN 进行求值来提高估算精度,同时也会考虑统计信息中的 NULL 数。求值操作预计会造成少量性能损耗。这个功能生效的前提是统计信息是在tidb_analyze_version
设为2
时收集的。 - 当该变量的值被设为默认值以外的值的时候,会对
not like
、not rlike
、not regexp
的行数估算也进行相应的调整。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
ON
-
这个变量用来设置是否禁用显式的乐观事务自动重试,设置为
ON
时,不会自动重试,如果遇到事务冲突需要在应用层重试。如果将该变量的值设为
OFF
,TiDB 将会自动重试事务,这样在事务提交时遇到的错误更少。需要注意的是,这样可能会导致数据更新丢失。这个变量不会影响自动提交的隐式事务和 TiDB 内部执行的事务,它们依旧会根据
tidb_retry_limit
的值来决定最大重试次数。关于是否需要禁用自动重试,请参考重试的局限性。
该变量只适用于乐观事务,不适用于悲观事务。悲观事务的重试次数由
max_retry_count
控制。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
15
- 范围:
[1, 256]
- 这个变量用来设置 scan 操作的并发度。
- AP 类应用适合较大的值,TP 类应用适合较小的值。对于 AP 类应用,最大值建议不要超过所有 TiKV 节点的 CPU 核数。
- 若表的分区较多可以适当调小该参数(取决于扫描数据量的大小以及扫描频率),避免 TiKV 内存溢出 (OOM)。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 范围:
[0, 2147483647]
- 这个变量的值大于
0
时,TiDB 会将INSERT
或LOAD DATA
等语句在更小的事务中批量提交。这样可减少内存使用,确保大批量修改时事务大小不会达到txn-total-size-limit
限制。 - 只有变量值为
0
时才符合 ACID 要求。否则无法保证 TiDB 的原子性和隔离性要求。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 指定是否在只涉及一个 Region 的事务上启用一阶段提交特性。比起传统两阶段提交,一阶段提交能大幅降低事务提交延迟并提升吞吐。
注意:
- 对于新创建的集群,默认值为 ON。对于升级版本的集群,如果升级前是 v5.0 以下版本,升级后默认值为
OFF
。- 启用 TiDB Binlog 后,开启该选项无法获得性能提升。要获得性能提升,建议使用 TiCDC 替代 TiDB Binlog。
- 启用该参数仅意味着一阶段提交成为可选的事务提交模式,实际由 TiDB 自行判断选择最合适的提交模式进行事务提交。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
OFF
-
这个变量用于控制是否开启
AMEND TRANSACTION
特性。在悲观事务模式下开启该特性后,如果该事务相关的表存在并发 DDL 操作和 SCHEMA VERSION 变更,TiDB 会尝试对该事务进行 amend 操作,修正该事务的提交内容,使其和最新的有效 SCHEMA VERSION 保持一致,从而成功提交该事务而不返回Information schema is changed
报错。该特性对以下并发 DDL 变更生效:ADD COLUMN
或DROP COLUMN
类型的 DDL 操作。MODIFY COLUMN
或CHANGE COLUMN
类型的 DDL 操作,且只对增大字段长度的操作生效。ADD INDEX
或DROP INDEX
类型的 DDL 操作,且操作的索引列须在事务开启之前创建。
注意:
目前该特性可能造成事务语义的变化,且与 TiDB Binlog 存在部分不兼容的场景,可以参考事务语义行为区别和与 TiDB Binlog 兼容问题汇总了解更多关于该特性的使用注意事项。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 该变量控制
ANALYZE
读取历史时刻的数据还是读取最新的数据。当该变量设置为ON
时,ANALYZE
读取ANALYZE
开始时刻的历史数据。当该变量设置为OFF
时,ANALYZE
读取最新的数据。 - 在 v5.2 之前,
ANALYZE
读取最新的数据。v5.2 至 v6.1 版本ANALYZE
读取ANALYZE
开始时刻的历史数据。
警告:
如果
ANALYZE
读取ANALYZE
开始时刻的历史数据,长时间的AUTO ANALYZE
可能会因为历史数据被 GC 而出现GC life time is shorter than transaction duration
的报错。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 该变量控制是否启用 Async Commit 特性,使事务两阶段提交的第二阶段于后台异步进行。开启本特性能降低事务提交的延迟。
注意:
- 对于新创建的集群,默认值为 ON。对于升级版本的集群,如果升级前是 v5.0 以下版本,升级后默认值为
OFF
。- 启用 TiDB Binlog 后,开启该选项无法获得性能提升。要获得性能提升,建议使用 TiCDC 替代 TiDB Binlog。
- 启用该参数仅意味着 Async Commit 成为可选的事务提交模式,实际由 TiDB 自行判断选择最合适的提交模式进行事务提交。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 该变量控制 TiDB 是否以后台操作自动更新表的统计信息。
- 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
performance.run-auto-analyze
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制是否允许在创建生成列或者表达式索引时引用自增列。
警告:
目前 cascades planner 为实验特性,不建议在生产环境中使用。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制是否开启 cascades planner。
- 作用域:SESSION
- 默认值:
ON
- 这个变量用来设置是否启用 Coprocessor 的
Chunk
数据编码格式。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
INT_ONLY
- 可选值:
OFF
,ON
,INT_ONLY
- 这个变量用于控制默认情况下表的主键是否使用聚簇索引。“默认情况”即不显式指定
CLUSTERED
/NONCLUSTERED
关键字的情况。可设置为OFF
/ON
/INT_ONLY
。OFF
表示所有主键默认使用非聚簇索引。ON
表示所有主键默认使用聚簇索引。INT_ONLY
此时的行为受配置项alter-primary-key
控制。如果该配置项取值为true
,则所有主键默认使用非聚簇索引;如果该配置项取值为false
,则由单个整数类型的列构成的主键默认使用聚簇索引,其他类型的主键默认使用非聚簇索引。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
ON
- 这个变量用于控制是否同时将各个执行算子的执行信息记录入 slow query log 中。
警告:
收集
PREDICATE COLUMNS
的统计信息目前为实验特性,不建议在生产环境中使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制是否开启 TiDB 对
PREDICATE COLUMNS
的收集。关闭该变量后,之前收集的PREDICATE COLUMNS
会被清除。详情见收集部分列的统计信息。
警告:
请勿修改该变量值,因为关闭后风险不确定,有可能导致集群元数据出错。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否让 TiDB 使用并发 DDL 语句。在开启并发 DDL 语句后,DDL 语句的执行流程有所改变,DDL 语句不容易被其他 DDL 语句阻塞,并且能够同时添加多个索引。
- 作用域:NONE
- 默认值:
OFF
- 这个变量表示所连接的 TiDB 服务器是否启用了安全增强模式 (SEM)。若要改变该变量值,你需要在 TiDB 服务器的配置文件中修改
enable-sem
项的值,并重启 TiDB 服务器。 - 安全增强模式受安全增强式 Linux 等系统设计的启发,削减拥有 MySQL
SUPER
权限的用户能力,转而使用细粒度的RESTRICTED
权限作为替代。这些细粒度的RESTRICTED
权限如下:RESTRICTED_TABLES_ADMIN
:能够写入mysql
库中的系统表,能查看information_schema
表上的敏感列。RESTRICTED_STATUS_ADMIN
:能够在SHOW STATUS
命令中查看敏感内容。RESTRICTED_VARIABLES_ADMIN
:能够在SHOW [GLOBAL] VARIABLES
和SET
命令中查看和设置包含敏感内容的变量。RESTRICTED_USER_ADMIN
:能够阻止其他用户更改或删除用户帐户。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 可选值:
OFF
和ON
- 该变量可以控制整个集群的只读状态。开启后(即该值为
ON
),整个集群中的 TiDB 服务器都将进入只读状态,只有SELECT
、USE
、SHOW
等不会修改数据的语句才能被执行,其他如INSERT
、UPDATE
等语句会被拒绝执行。 - 该变量开启只读模式只保证整个集群最终进入只读模式,当变量修改状态还没被同步到其他 TiDB 服务器时,尚未同步的 TiDB 仍然停留在非只读模式。
- 在变量开启时,正在执行的 SQL 语句不会受影响,只对新执行的 SQL 语句进行是否只读的检查。
- 在变量开启时,对于尚未提交的事务:
- 如果有尚未提交的只读事务,可正常提交该事务。
- 如果尚未提交的事务为非只读事务,在事务内执行写入的 SQL 语句会被拒绝。
- 如果尚未提交的事务已经有数据改动,其提交也会被拒绝。
- 当集群开启只读模式后,所有用户(包括
SUPER
用户)都无法执行可能写入数据的 SQL 语句,除非该用户被显式地授予了RESTRICTED_REPLICA_WRITER_ADMIN
权限。 - 拥有
RESTRICTED_VARIABLES_ADMIN
或SUPER
权限的用户可以修改该变量。如果用户开启了安全增强模式 (Security Enhanced Mode),则只有RESTRICTED_VARIABLES_ADMIN
权限的用户才能修改该变量。
警告:
目前快速分析功能为实验特性,不建议在生产环境中使用。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来控制是否启用统计信息快速分析功能。默认值 0 表示不开启。
- 快速分析功能开启后,TiDB 会随机采样约 10000 行的数据来构建统计信息。因此在数据分布不均匀或者数据量比较少的情况下,统计信息的准确度会比较低。这可能导致执行计划不优,比如选错索引。如果可以接受普通
ANALYZE
语句的执行时间,则推荐关闭快速分析功能。
注意:
- 当集群从 v4.0.0 以下版本升级到 v5.4.0 及以上版本时,该变量开关默认关闭,防止升级后计划发生变化导致回退。
- 当集群从 v4.0.0 及以上版本升级到 v5.4.0 及以上版本时,该变量开关保持升级前的状态。
- 对于 v5.4.0 及以上版本的新建集群,该变量开关默认开启。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否开启 index merge 功能。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于允许使用
SET SESSION
对INSTANCE
作用域的变量进行设置,用法同SET GLOBAL
。 - 为了兼容之前的 TiDB 版本,该变量值默认为
ON
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来设置是否开启
LIST (COLUMNS) TABLE PARTITION
特性。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于设置是否开启 mutation checker。mutation checker 是一项在 DML 语句执行过程中进行的数据索引一致性校验,校验报错会回滚当前语句。开启该校验会导致 CPU 使用轻微上升。详见数据索引一致性报错。
- 对于新创建的 v6.0.0 及以上的集群,默认值为
ON
。对于升级版本的集群,如果升级前是低于 v6.0.0 的版本,升级后默认值为OFF
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 默认情况下,用户尝试将某些语法用于尚未实现的功能时,TiDB 会报错。若将该变量值设为
ON
,TiDB 则自动忽略此类功能不可用的情况,即不会报错。若用户无法更改 SQL 代码,可考虑将变量值设为ON
。 - 启用
noop
函数可以控制以下行为:LOCK IN SHARE MODE
语法SQL_CALC_FOUND_ROWS
语法START TRANSACTION READ ONLY
和SET TRANSACTION READ ONLY
语法tx_read_only
、transaction_read_only
、offline_mode
、super_read_only
、read_only
以及sql_auto_is_null
系统变量GROUP BY <expr> ASC|DESC
语法
警告:
该变量只有在默认值
OFF
时,才算是安全的。因为设置tidb_enable_noop_functions=1
后,TiDB 会自动忽略某些语法而不报错,这可能会导致应用程序出现异常行为。例如,允许使用语法START TRANSACTION READ ONLY
时,事务仍会处于读写模式。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 若该变量值为
OFF
,TiDB 具有以下行为:- 使用
SET
设置noop
的系统变量时会报"setting *variable_name* has no effect in TiDB"
的警告。 SHOW [SESSION | GLOBAL] VARIABLES
的结果不显示noop
的系统变量。- 使用
SELECT
读取noop
的系统变量时会报"variable *variable_name* has no effect in TiDB"
的警告。
- 使用
- 你可以通过
SELECT * FROM INFORMATION_SCHEMA.CLIENT_ERRORS_SUMMARY_GLOBAL;
语句来检查 TiDB 实例是否曾设置和读取noop
系统变量。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:在 v6.1.0 中为
ON
,即默认开启。在 v6.1.0 之后的版本中为OFF
,即默认关闭。 - 自 v6.1.0 起,TiDB 的 Join Reorder 算法 开始支持 Outer Join。该变量用于控制这个支持行为。默认关闭,即不启用 Outer Join 的 Join Reorder。
- 对于从 v6.1.0 之前版本升级到 v6.1.0 及之后的版本,该变量的默认值为
OFF
。对于从 v6.1.0 版本升级到之后的版本,该变量默认值为ON
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 指定是否对最终的输出结果进行自动排序。
- 例如,开启该变量后,TiDB 会将
SELECT a, MAX(b) FROM t GROUP BY a
处理为SELECT a, MAX(b) FROM t GROUP BY a ORDER BY a, MAX(b)
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制
IndexLookUp
算子是否使用分页 (paging) 方式发送 Coprocessor 请求。 - 适用场景:对于使用
IndexLookUp
和Limit
并且Limit
无法下推到IndexScan
上的读请求,可能会出现读请求的延迟高、TiKV 的 Unified read pool CPU 使用率高的情况。在这种情况下,由于Limit
算子只需要少部分数据,开启tidb_enable_paging
,能够减少处理数据的数量,从而降低延迟、减少资源消耗。 - 开启
tidb_enable_paging
后,Limit
无法下推且数量小于960
的IndexLookUp
请求会使用 paging 方式发送 Coprocessor 请求。Limit
的值越小,优化效果会越明显。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:0
- 这个变量用于控制是否开启 Apply 算子并发,并发数由
tidb_executor_concurrency
变量控制。Apply 算子用来处理关联子查询且默认无并发,所以执行速度较慢。打开 Apply 并发开关可增加并发度,提高执行速度。目前默认关闭。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制是否开启 Prepared Plan Cache。开启后,对
Prepare
、Execute
请求的执行计划会进行缓存,以便在后续执行时跳过查询计划优化这个步骤,获得性能上的提升。 - 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
prepared-plan-cache.enabled
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制优化器在一张表上的统计信息过期时的行为。
- 统计信息过期的判断标准:最近一次对某张表执行
ANALYZE
获得统计信息后,该表数据被修改的行数大于该表总行数的 80%,便可判定该表的统计信息已过期。该比例可通过pseudo-estimate-ratio
配置参数调整。 - 默认情况下(即该变量值为
ON
时),某张表上的统计信息过期后,优化器认为该表上除总行数以外的统计信息不再可靠,转而使用 pseudo 统计信息。将该变量值设为OFF
后,即使统计信息过期,优化器也仍会使用该表上的统计信息。 - 如果表数据修改较频繁,没有及时对表执行
ANALYZE
,但又希望执行计划保持稳定,可以将该变量值设为OFF
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量控制是否为读数据的算子开启动态内存控制功能。读数据的算子默认启用
tidb_distsql_scan_concurrency
所允许的最大线程数来读取数据。当单条 SQL 语句的内存使用每超过tidb_mem_quota_query
一次,读数据的算子会停止一个线程。 - 当读数据的算子只剩 1 个线程且当单条 SQL 语句的内存使用继续超过
tidb_mem_quota_query
时,该 SQL 语句会触发其它的内存控制行为,例如落盘。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
ON
- 这个变量用于控制是否开启 slow log 功能。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制是否开启 statement summary 功能。如果开启,SQL 的耗时等执行信息将被记录到系统表
information_schema.STATEMENTS_SUMMARY
中,用于定位和排查 SQL 性能问题。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制是否可以用
DOUBLE
类型的无效定义创建表。该设置的目的是提供一个从 TiDB 早期版本升级的方法,因为早期版本在验证类型方面不太严格。 - 该变量的默认值
ON
与 MySQL 兼容。
例如,由于无法保证浮点类型的精度,现在将 DOUBLE(10)
类型视为无效。将 tidb_enable_strict_double_type_check
更改为 OFF
后,将会创建表。如下所示:
CREATE TABLE t1 (id int, c double(10));
ERROR 1149 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use
SET tidb_enable_strict_double_type_check = 'OFF';
Query OK, 0 rows affected (0.00 sec)
CREATE TABLE t1 (id int, c double(10));
Query OK, 0 rows affected (0.09 sec)
注意:
该设置仅适用于
DOUBLE
类型,因为 MySQL 允许为FLOAT
类型指定精度。从 MySQL 8.0.17 开始已弃用此行为,不建议为FLOAT
或DOUBLE
类型指定精度。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 可选值:
OFF
,ON
,AUTO
- 这个变量用来设置是否开启
TABLE PARTITION
特性。目前变量支持以下三种值:- 默认值
ON
表示开启 TiDB 当前已实现了的分区表类型,目前 Range partition、Hash partition 以及 Range column 单列的场景会生效。 AUTO
目前作用和ON
一样。OFF
表示关闭TABLE PARTITION
特性,此时语法还是保持兼容,只是创建的表并不是真正的分区表,而是普通的表。
- 默认值
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于动态地控制 TiDB 遥测功能是否开启。设置为
OFF
可以关闭 TiDB 遥测功能。当所有 TiDB 实例都设置enable-telemetry
为false
时将忽略该系统变量并总是关闭 TiDB 遥测功能。参阅遥测了解该功能详情。
警告:
Top SQL 目前是实验性功能,不建议在生产环境中使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用控制是否开启 Top SQL 特性。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来开启 TSO Follower Proxy 特性。当该值为
OFF
时,TiDB 仅会从 PD leader 获取 TSO。开启该特性之后,TiDB 在获取 TSO 时会将请求均匀地发送到所有 PD 节点上,通过 PD follower 转发 TSO 请求,从而降低 PD leader 的 CPU 压力。 - 适合开启 TSO Follower Proxy 的场景:
- PD leader 因高压力的 TSO 请求而达到 CPU 瓶颈,导致 TSO RPC 请求的延迟较高。
- 集群中的 TiDB 实例数量较多,且调高
tidb_tso_client_batch_max_wait_time
并不能缓解 TSO RPC 请求延迟高的问题。
注意:
如果 PD leader 的 TSO RPC 延迟升高,但其现象并非由 CPU 使用率达到瓶颈而导致(可能存在网络等问题),此时,打开 TSO Follower Proxy 可能会导致 TiDB 的语句执行延迟上升,从而影响集群的 QPS 表现。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否开启向量化执行。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制是否开启窗口函数的支持。默认值 1 代表开启窗口函数的功能。
- 由于窗口函数会使用一些保留关键字,可能导致原先可以正常执行的 SQL 语句在升级 TiDB 后无法被解析语法,此时可以将
tidb_enable_window_function
设置为OFF
。
- 作用域:SESSION
- 默认值:
OFF
(表示关闭)。如需修改此变量的默认值,请配置performance.enforce-mpp
参数。 - 这个变量用于控制是否忽略优化器代价估算,强制使用 TiFlash 的 MPP 模式执行查询,可以设置的值包括:
- 0 或 OFF,代表不强制使用 MPP 模式(默认)
- 1 或 ON,代表将忽略代价估算,强制使用 MPP 模式。注意:只有当
tidb_allow_mpp=true
时该设置才生效。
MPP 是 TiFlash 引擎提供的分布式计算框架,允许节点之间的数据交换并提供高性能、高吞吐的 SQL 算法。MPP 模式选择的详细说明参见控制是否选择 MPP 模式。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
OFF
-
这个变量用于控制是否启用自动演进绑定功能。该功能的详细介绍和使用方法可以参考自动演进绑定。
-
为了减少自动演进对集群的影响,可以进行以下配置:
- 设置
tidb_evolve_plan_task_max_time
,限制每个执行计划运行的最长时间,其默认值为 600s; - 设置
tidb_evolve_plan_task_start_time
和tidb_evolve_plan_task_end_time
,限制运行演进任务的时间窗口,默认值分别为00:00 +0000
和23:59 +0000
。
- 设置
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
23:59 +0000
- 这个变量用来设置一天中允许自动演进的结束时间。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
600
- 范围:
[-1, 9223372036854775807]
- 单位:秒
- 该变量用于限制自动演进功能中,每个执行计划运行的最长时间。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
00:00 +0000
- 这个变量用来设置一天中允许自动演进的开始时间。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
5
- 范围:
[1, 256]
变量用来统一设置各个 SQL 算子的并发度,包括:
index lookup
index lookup join
hash join
hash aggregation
(partial 和 final 阶段)window
projection
tidb_executor_concurrency
整合了已有的系统变量,方便管理。这些变量所列如下:
tidb_index_lookup_concurrency
tidb_index_lookup_join_concurrency
tidb_hash_join_concurrency
tidb_hashagg_partial_concurrency
tidb_hashagg_final_concurrency
tidb_projection_concurrency
tidb_window_concurrency
v5.0 后,用户仍可以单独修改以上系统变量(会有废弃警告),且修改只影响单个算子。后续通过 tidb_executor_concurrency
的修改也不会影响该算子。若要通过 tidb_executor_concurrency
来管理所有算子的并发度,需要将以上所列变量的值设置为 -1
。
对于从 v5.0 之前的版本升级到 v5.0 的系统,如果用户对上述所列变量的值没有做过改动(即 tidb_hash_join_concurrency
值为 5
,其他值为 4
),则会自动转为使用 tidb_executor_concurrency
来统一管理算子并发度。如果用户对上述变量的值做过改动,则沿用之前的变量对相应的算子做并发控制。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
60
- 范围:
[10, 2147483647]
- 单位:秒
- 这个变量用来控制打印 expensive query 日志的阈值时间,默认值是 60 秒。expensive query 日志和慢日志的差别是,慢日志是在语句执行完后才打印,expensive query 日志可以把正在执行中的语句且执行时间超过阈值的语句及其相关信息打印出来。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
NO_PRIORITY
- 这个变量用于改变 TiDB server 上执行的语句的默认优先级。例如,你可以通过设置该变量来确保正在执行 OLAP 查询的用户优先级低于正在执行 OLTP 查询的用户。
- 默认值
NO_PRIORITY
表示不强制改变执行语句的优先级,其它优先级从低到高可设置为LOW_PRIORITY
、DELAYED
或HIGH_PRIORITY
。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于指定是否在 slow log 和 statement summary 里包含以二进制格式编码的执行计划。
- 开启该变量后,即可在 TiDB Dashboard 中查看查询的图形化执行计划。注意,TiDB Dashboard 只显示变量开启时产生的查询的执行计划。
- 用
select tidb_decode_binary_plan('xxx...')
SQL 语句可以从编码后的执行计划解析出具体的执行计划。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用于指定 GC 在Resolve Locks(清理锁)步骤中线程的数量。默认值
-1
表示由 TiDB 自主判断运行 GC 要使用的线程的数量。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否启用 TiKV 的垃圾回收 (GC) 机制。如果不启用 GC 机制,系统将不再清理旧版本的数据,因此会有损系统性能。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
10m0s
- 范围:
[10m0s, 8760h0m0s]
- 这个变量用于指定每次进行垃圾回收 (GC) 时保留数据的时限。变量值为 Go 的 Duration 字符串格式。每次进行 GC 时,将以当前时间减去该变量的值作为 safe point。
Note:
- 在数据频繁更新的场景下,将
tidb_gc_life_time
的值设置得过大(如数天甚至数月)可能会导致一些潜在的问题,如:
- 占用更多的存储空间。
- 大量的历史数据可能会在一定程度上影响系统性能,尤其是范围的查询(如
select count(*) from t
)。- 如果一个事务的运行时长超过了
tidb_gc_life_time
配置的值,在 GC 时,为了使这个事务可以继续正常运行,系统会保留从这个事务开始时间start_ts
以来的数据。例如,如果tidb_gc_life_time
的值配置为 10 分钟,且在一次 GC 时,集群正在运行的事务中最早开始的那个事务已经运行了 15 分钟,那么本次 GC 将保留最近 15 分钟的数据。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
86400
- 范围:
[600, 31536000]
- 单位:秒
- 这个变量用于指定活跃事务阻碍 GC safe point 推进的最大时间。每次进行 GC 时,默认 GC safe point 不会超过正在执行中的事务的开始时间。如果活跃事务运行时间未超过该值,GC safe point 会一直被阻塞不更新,直到活跃事务运行时间超过该值 safe point 才会正常推进。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
10m0s
- 范围:
[10m0s, 8760h0m0s]
- 这个变量用于指定垃圾回收 (GC) 运行的时间间隔。变量值为 Go 的 Duration 字符串格式,如
"1h30m"
、"15m"
等。
警告:
Green GC 目前是实验性功能,不建议在生产环境中使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
LEGACY
- 可设置为:
PHYSICAL
,LEGACY
LEGACY
:使用旧的扫描方式,即禁用 Green GC。PHYSICAL
:使用物理扫描方式,即启用 Green GC。
- 这个变量用于指定垃圾回收 (GC) 的 Resolve Locks(清理锁)步骤中扫描锁的方式。当变量值设置为
LEGACY
时,TiDB 以 Region 为单位进行扫描。当变量值设置为PHYSICAL
时,每个 TiKV 节点分别绕过 Raft 层直接扫描数据,可以有效地缓解在启用 Hibernate Region 功能时,GC 唤醒全部 Region 的影响,从而提升 Resolve Locks(清理锁)这个步骤的执行速度。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
OFF
- 这个变量用来设置是否在日志里记录所有的 SQL 语句。该功能默认关闭。如果系统运维人员在定位问题过程中需要追踪所有 SQL 记录,可考虑开启该功能。
- 通过查询
"GENERAL_LOG"
字符串可以定位到该功能在日志中的所有记录。日志会记录以下内容:conn
:当前会话对应的 IDuser
:当前会话用户schemaVersion
:当前 schema 版本txnStartTS
:当前事务的开始时间戳forUpdateTS
:事务模式为悲观事务时,SQL 语句的当前时间戳。悲观事务内发生写冲突时,会重试当前执行语句,该时间戳会被更新。重试次数由max-retry-count
配置。事务模式为乐观事务时,该条目与txnStartTS
等价。isReadConsistency
:当前事务隔离级别是否是读已提交 (RC)current_db
:当前数据库名txn_mode
:事务模式。可选值:OPTIMISTIC
(乐观事务模式),或PESSIMISTIC
(悲观事务模式)sql
:当前查询对应的 SQL 语句
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:布尔值
- 默认值:
OFF
- 此变量控制异步提交 (Async Commit) 中提交时间戳的计算方式。默认情况下(使用
OFF
值),两阶段提交从 PD 服务器请求一个新的时间戳,并使用该时间戳计算最终提交的时间戳,这样可保证所有并发事务可线性化。 - 如果将该变量值设为
ON
,从 PD 获取的时间戳的操作会被省掉,这种情况下只保证因果一致性但不保证线性一致性。详情请参考 PingCAP 博文 Async Commit 原理介绍。 - 对于需要只保证因果一致性的场景,可将此变量设为
ON
以提升性能。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用来设置 hash join 算法的并发度。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用来设置并行 hash aggregation 算法 final 阶段的执行并发度。对于聚合函数参数不为 distinct 的情况,HashAgg 分为 partial 和 final 阶段分别并行执行。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用来设置并行 hash aggregation 算法 partial 阶段的执行并发度。对于聚合函数参数不为 distinct 的情况,HashAgg 分为 partial 和 final 阶段分别并行执行。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来设置是否忽略关闭 Prepared Statement 的指令。
- 如果变量值设为
ON
,Binary 协议的COM_STMT_CLOSE
信号和文本协议的DEALLOCATE PREPARE
语句都会被忽略。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
25000
- 范围:
[1, 2147483647]
- 这个变量用来设置 index lookup join 操作的 batch 大小,AP 类应用适合较大的值,TP 类应用适合较小的值。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用来设置 index lookup 操作的并发度,AP 类应用适合较大的值,TP 类应用适合较小的值。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用来设置 index lookup join 算法的并发度。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
20000
- 范围:
[1, 2147483647]
- 这个变量用来设置 index lookup 操作的 batch 大小,AP 类应用适合较大的值,TP 类应用适合较小的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1
- 范围:
[1, 256]
- 这个变量用来设置顺序 scan 操作的并发度,AP 类应用适合较大的值,TP 类应用适合较小的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
32
- 范围:
[1, 32]
- 这个变量用来设置执行过程中初始 chunk 的行数。默认值是 32,可设置的范围是 1~32。
- 作用域:SESSION
- 默认值:
tikv,tiflash,tidb
- 这个变量用于设置 TiDB 在读取数据时可以使用的存储引擎列表。
- 作用域:SESSION
- 默认值:""
- 这是一个只读变量。用于在 TiDB 内部查询上一条 DML 语句的事务信息。查询的事务信息包括:
txn_scope
:事务的作用域,可能为global
或local
。start_ts
:事务开始的时间戳。for_update_ts
:先前执行的 DML 语句的for_update_ts
信息。这是 TiDB 用于测试的内部术语。通常,你可以忽略此信息。error
:错误消息(如果有)。
- 作用域:SESSION
- 是否持久化到集群:否
- 类型:字符串
- 此变量用于获取当前会话中最后一个事务的信息。这是一个只读变量。事务信息包括:
- 事务的范围
- 开始时间戳和提交时间戳
- 事务的提交模式,可能是两阶段提交,一阶段提交,或者异步提交
- 事务从异步提交或一阶段提交到两阶段提交的回退信息
- 遇到的错误
- 作用域:SESSION
- 默认值:
0
- 范围:
[0, 2147483647]
- 这个变量可以调整当前 TiDB 实例上日志的最大保留天数。默认值是实例配置文件中指定的值,见配置项
max-days
。此变量只影响当前 TiDB 实例上的配置,重启后丢失,且配置文件不受影响。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来设置是否启用低精度 TSO 特性。开启该功能之后,新事务会使用一个每 2s 更新一次的 TS 来读取数据。
- 主要场景是在可以容忍读到旧数据的情况下,降低小的只读事务获取 TSO 的开销。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来设置是否在非事务语句中立刻返回错误。当设为
OFF
时,在碰到第一个报错的 batch 时,非事务 DML 语句即中止,取消其后的所有 batch,返回错误。当设为ON
时,当某个 batch 执行报错时,其后的 batch 会继续执行,直到所有 batch 执行完毕,返回结果时把这些错误合并后返回。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1024
- 范围:
[32, 2147483647]
- 这个变量用来设置执行过程中一个 chunk 最大的行数,设置过大可能引起缓存局部性的问题。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
50000
- 范围:
[1, 2147483647]
- 单位:行
- 这个变量用来设置 coprocessor 协议中 paging size 的最大的行数。请合理设置该值,设置过小,TiDB 与 TiKV 的 RPC 交互会更频繁;设置过大,导数据和全表扫等特定场景会占用更多内存。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
1024
- 范围:
[100, 16384]
- 这个变量用来设置缓存 schema 版本信息(对应版本修改的相关 table IDs)的个数限制,可设置的范围 100 - 16384。此变量在 2.1.18 及之后版本支持。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
CANCEL
- 可选值:
CANCEL
,LOG
- 该变量控制当单个查询使用的内存超过限制 (
tidb_mem_quota_query
) 且不能再利用临时磁盘时,TiDB 所采取的操作。详情见 TiDB 内存控制。 - 该变量默认值为
CANCEL
,但在 TiDB v4.0.2 及之前的版本中,默认值为LOG
。 - 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
oom-action
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
警告:
目前限制 ANALYZE 的内存使用量为实验特性,在生产环境中使用时可能存在内存统计有误差的情况。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 单位:字节
- 这个变量用来控制 TiDB 更新统计信息时的最大总内存占用,包括用户执行的
ANALYZE TABLE
和 TiDB 后台自动执行的统计信息更新任务。当总的内存占用超过这个阈值时,用户执行的ANALYZE
会被终止退出,并通过错误信息提示用户尝试更小的采样率或稍后重试。如果 TiDB 后台自动执行的统计信息更新任务因内存超限而退出,且使用的采样率高于默认值,则会使用默认采样率重试一次。当该变量值为负数或零时,TiDB 不对更新统计信息的前后台任务进行内存限制。
注意:
只有在 TiDB 的启动配置文件中开启了
run-auto-analyze
选项,该 TiDB 集群才会触发auto_analyze
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
33554432
(32 MiB) - 范围:
[0, 9223372036854775807]
- 单位:字节
- 这个变量用来设置
Apply
算子中局部 Cache 的内存使用阈值。 Apply
算子中局部 Cache 用来加速Apply
算子的计算,该变量可以设置Apply
Cache 的内存使用阈值。设置变量值为0
可以关闭Apply
Cache 功能。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
67108864
(64 MiB) - 范围:
[0, 2147483647]
- 单位:字节
- 这个变量用来设置存放
binding
的缓存的内存使用阈值。 - 如果一个系统创建或者捕获了过多的绑定,导致绑定所使用的内存空间超过该阈值,TiDB 会在日志中增加警告日志进行提示。这种情况下,缓存无法存放所有可用的绑定,并且无法保证哪些绑定存在于缓存中,因此,可能存在一些查询无法使用可用绑定的情况。此时,可以调大该变量的值,从而保证所有可用绑定都能正常使用。修改变量值以后,需要执行命令
admin reload bindings
重新加载绑定,确保变更生效。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1073741824
(1 GiB) - 范围:
[-1, 9223372036854775807]
- 单位:字节
- 这个变量用来设置一条查询语句的内存使用阈值。
- 如果一条查询语句执行过程中使用的内存空间超过该阈值,会触发系统变量
tidb_mem_oom_action
中指定的行为。 - 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
mem-quota-query
) 进行配置,且作用域为SESSION
。升级到 v6.1.0 时会自动继承原有设置,作用域变更为SESSION | GLOBAL
。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
0.8
- TiDB 内存使用占总内存的比例超过一定阈值时会报警。该功能的详细介绍和使用方法可以参考
memory-usage-alarm-ratio
。 - 该变量的初始值可通过
memory-usage-alarm-ratio
进行配置。
- 作用域:SESSION
- 默认值:
60
- 范围:
[10, 216000]
- 单位:秒
- 这个变量设置了查询
METRIC_SCHEMA
时生成的 Prometheus 语句的 range duration。
- 作用域:SESSION
- 默认值:
60
- 范围:
[10, 216000]
- 单位:秒
- 这个变量设置了查询
METRIC_SCHEMA
时生成的 Prometheus 语句的 step。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
128
- 范围:
[1, 2147483647]
- 单位:行
- 这个变量用来设置 coprocessor 协议中 paging size 的最小的行数。请合理设置该值,设置过小,TiDB 与 TiKV 的 RPC 交互会更频繁;设置过大,IndexLookup 带 Limit 场景会出现性能下降。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 可选值:
OFF
,ON
,WARN
- 该变量用于控制是否在同一个
COM_QUERY
调用中执行多个查询。 - 为了减少 SQL 注入攻击的影响,TiDB 目前默认不允许在同一
COM_QUERY
调用中执行多个查询。该变量可用作早期 TiDB 版本的升级路径选项。该变量值与是否允许多语句行为的对照表如下:
客户端设置 | tidb_multi_statement_mode 值 |
是否允许多语句 |
---|---|---|
Multiple Statements = ON | OFF | 允许 |
Multiple Statements = ON | ON | 允许 |
Multiple Statements = ON | WARN | 允许 |
Multiple Statements = OFF | OFF | 不允许 |
Multiple Statements = OFF | ON | 允许 |
Multiple Statements = OFF | WARN | 允许 + 警告提示 |
注意:
只有默认值
OFF
才是安全的。如果用户业务是专为早期 TiDB 版本而设计的,那么需要将该变量值设为ON
。如果用户业务需要多语句支持,建议用户使用客户端提供的设置,不要使用tidb_multi_statement_mode
变量进行设置。
- go-sql-driver (
multiStatements
)- Connector/J (
allowMultiQueries
)- PHP mysqli (
mysqli_multi_query
)
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 可选值:
OFF
,ON
- TiDB v6.2.0 对代价模型的实现进行了代码层面的重构,这个变量用来控制是否使用重构后的代价模型 Cost Model Version 2。
- 重构后的代价模型使用完全一样的代价公式,因此不会引起计划选择的变动,此开关默认打开。
- 从 v6.1 升级至 v6.2 的用户,此开关保持升级前的
OFF
状态,此时建议直接打开;对于从 v6.1 之前版本升级至 v6.2 的用户,此开关默认为ON
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 可选值:
OFF
,ON
- 该变量用于控制用于控制 TiDB 执行
ONLY_FULL_GOUP_BY
检查时的行为。有关ONLY_FULL_GROUP_BY
的信息可以参考 MySQL 文档。在 v6.1 中 TiDB 对该项检查做了更严格正确的处理。 - 由于可能存在版本升级造成的兼容性问题,在 v6.1 中该变量默认值是
OFF
,即默认关闭。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来设置优化器是否执行聚合函数下推到 Join,Projection 和 UnionAll 之前的优化操作。当查询中聚合操作执行很慢时,可以尝试设置该变量为 ON。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:整数
- 默认值:
1
- 范围:
[0, 2]
- 表示是否允许 Broadcast Cartesian Join 算法。
- 值为
0
时表示不允许使用 Broadcast Cartesian Join 算法。值为1
时表示根据tidb_broadcast_join_threshold_count
的行数阈值确定是否允许使用 Broadcast Cartesian Join 算法。值为2
时表示总是允许 Broadcast Cartesian Join 算法,即使表的大小超过了该阈值。 - 该变量是 TiDB 内部使用的变量,不推荐修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
3.0
- 表示在 TiDB 中开启一个 Golang goroutine 的 CPU 开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
3.0
- 表示 TiKV 协处理器处理一行数据的 CPU 开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
1
- 范围:
[0, 2147483647]
- 当交叉估算方法不可用时,会采用启发式估算方法。这个变量用来控制启发式方法的行为。当值为 0 时不用启发式估算方法,大于 0 时,该变量值越大,启发式估算方法越倾向 index scan,越小越倾向 table scan。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
0.9
- 这个变量用来设置优化器启用交叉估算 row count 方法的阈值。如果列和 handle 列之间的顺序相关性超过这个阈值,就会启用交叉估算方法。
- 交叉估算方法可以简单理解为,利用这个列的直方图来估算 handle 列需要扫的行数。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
3.0
- 表示 TiDB 处理一行数据的 CPU 开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
3.0
- 表示降序扫描时,TiKV 在磁盘上扫描一行数据的开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
1.5
- 表示 TiDB 往临时磁盘读写一个字节数据的 I/O 开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来设置优化器是否执行带有
Distinct
的聚合函数(比如select count(distinct a) from t
)下推到 Coprocessor 的优化操作。当查询中带有Distinct
的聚合操作执行很慢时,可以尝试设置该变量为1
。
在以下示例中,tidb_opt_distinct_agg_push_down
开启前,TiDB 需要从 TiKV 读取所有数据,并在 TiDB 侧执行 distinct
。tidb_opt_distinct_agg_push_down
开启后,distinct a
被下推到了 Coprocessor,在 HashAgg_5
里新增里一个 group by
列 test.t.a
。
mysql> desc select count(distinct a) from test.t;
+-------------------------+----------+-----------+---------------+------------------------------------------+
| id | estRows | task | access object | operator info |
+-------------------------+----------+-----------+---------------+------------------------------------------+
| StreamAgg_6 | 1.00 | root | | funcs:count(distinct test.t.a)->Column#4 |
| └─TableReader_10 | 10000.00 | root | | data:TableFullScan_9 |
| └─TableFullScan_9 | 10000.00 | cop[tikv] | table:t | keep order:false, stats:pseudo |
+-------------------------+----------+-----------+---------------+------------------------------------------+
3 rows in set (0.01 sec)
mysql> set session tidb_opt_distinct_agg_push_down = 1;
Query OK, 0 rows affected (0.00 sec)
mysql> desc select count(distinct a) from test.t;
+---------------------------+----------+-----------+---------------+------------------------------------------+
| id | estRows | task | access object | operator info |
+---------------------------+----------+-----------+---------------+------------------------------------------+
| HashAgg_8 | 1.00 | root | | funcs:count(distinct test.t.a)->Column#3 |
| └─TableReader_9 | 1.00 | root | | data:HashAgg_5 |
| └─HashAgg_5 | 1.00 | cop[tikv] | | group by:test.t.a, |
| └─TableFullScan_7 | 10000.00 | cop[tikv] | table:t | keep order:false, stats:pseudo |
+---------------------------+----------+-----------+---------------+------------------------------------------+
4 rows in set (0.00 sec)
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制优化器是否开启交叉估算。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
ON
-
这个变量用来设置是否开启优化规则:将子查询转成 join 和 aggregation。
例如,打开这个优化规则后,会将下面子查询做如下变化:
{{< copyable "sql" >}}
select * from t where t.a in (select aa from t1);
将子查询转成如下 join:
{{< copyable "sql" >}}
select t.* from t, (select aa from t1 group by aa) tmp_t where t.a = tmp_t.aa;
如果 t1 在列
aa
上有 unique 且 not null 的限制,可以直接改写为如下,不需要添加 aggregation。{{< copyable "sql" >}}
select t.* from t, t1 where t.a=t1.aa;
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
100
- 范围:
[0, 2147483647]
- 这个变量用来设置将 Limit 和 TopN 算子下推到 TiKV 的阈值。
- 如果 Limit 或者 TopN 的取值小于等于这个阈值,则 Limit 和 TopN 算子会被强制下推到 TiKV。该变量可以解决部分由于估算误差导致 Limit 或者 TopN 无法被下推的问题。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
0.001
- 表示 TiDB 存储一行数据的内存开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:布尔值
- 默认值:
ON
- 当该变量值为
ON
时,左连接始终使用内表作为构建端,右连接始终使用外表作为构建端。将该变量值设为OFF
后,外连接可以灵活选择任意一边表作为构建端。
- 作用域:SESSION | GLOBAL
- 是否持久化
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
1.0
- 表示传输 1 比特数据的网络净开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 将该变量值设为
ON
后,优化器总是偏好区间扫描而不是全表扫描。 - 在以下示例中,
tidb_opt_prefer_range_scan
开启前,TiDB 优化器需要执行全表扫描。tidb_opt_prefer_range_scan
开启后,优化器选择了索引区间扫描。
explain select * from t where age=5;
+-------------------------+------------+-----------+---------------+-------------------+
| id | estRows | task | access object | operator info |
+-------------------------+------------+-----------+---------------+-------------------+
| TableReader_7 | 1048576.00 | root | | data:Selection_6 |
| └─Selection_6 | 1048576.00 | cop[tikv] | | eq(test.t.age, 5) |
| └─TableFullScan_5 | 1048576.00 | cop[tikv] | table:t | keep order:false |
+-------------------------+------------+-----------+---------------+-------------------+
3 rows in set (0.00 sec)
set session tidb_opt_prefer_range_scan = 1;
explain select * from t where age=5;
+-------------------------------+------------+-----------+-----------------------------+-------------------------------+
| id | estRows | task | access object | operator info |
+-------------------------------+------------+-----------+-----------------------------+-------------------------------+
| IndexLookUp_7 | 1048576.00 | root | | |
| ├─IndexRangeScan_5(Build) | 1048576.00 | cop[tikv] | table:t, index:idx_age(age) | range:[5,5], keep order:false |
| └─TableRowIDScan_6(Probe) | 1048576.00 | cop[tikv] | table:t | keep order:false |
+-------------------------------+------------+-----------+-----------------------------+-------------------------------+
3 rows in set (0.00 sec)
- 作用域:SESSION
- 是否持久化到集群:否
- 类型:布尔值
- 默认值:
OFF
- 指定是否允许优化器将
Projection
算子下推到 TiKV 或者 TiFlash。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
1.5
- 表示升序扫描时,TiKV 在磁盘上扫描一行数据的开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:浮点数
- 范围:
[0, 2147483647]
- 默认值:
20
- 表示 TiDB 从 TiKV 请求数据的初始开销。该变量是代价模型内部使用的变量,不建议修改该变量的值。
注意:
开启该变量带来的查询性能优化仅对 TiFlash 有效。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来设置优化器是否将带有
DISTINCT
的聚合函数(例如SELECT b, count(DISTINCT a) FROM t GROUP BY b
)改写为两层聚合函数(例如SELECT b, count(a) FROM (SELECT b, a FROM t GROUP BY b, a) t GROUP BY b
)。当聚合列有严重的数据倾斜,且DISTINCT
列有很多不同的值时,这种改写能够避免查询执行过程中的数据倾斜,从而提升查询性能。
- 作用域:SESSION
- 默认值:
OFF
- 这个变量用来设置是否允许
INSERT
、REPLACE
和UPDATE
操作_tidb_rowid
列,默认是不允许操作。该选项仅用于 TiDB 工具导数据时使用。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:static
- 这个变量用来设置是否开启分区表动态裁剪模式。关于动态裁剪模式的详细说明请参阅分区表动态裁剪模式。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否开启 ANALYZE 配置持久化特性。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
STRICT
- 可选值:
STRICT
,IGNORE
- 该变量用于控制 DDL 语句是否忽略 Placement Rules in SQL 指定的放置规则。变量值为
IGNORE
时将忽略所有放置规则选项。 - 该变量可由逻辑转储或逻辑恢复工具使用,确保即使绑定了不合适的放置规则,也始终可以成功创建表。这类似于 mysqldump 将
SET FOREIGN_KEY_CHECKS=0;
写入每个转储文件的开头部分。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
0
- 范围:
[0, 1]
- 这个变量用来控制是否在 profile 输出中标记出对应的 SQL 语句,用于定位和排查性能问题。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0.1
- 范围:
[0, 1]
- 这个变量用来控制 Prepared Plan Cache 触发内存保护机制的阈值,具体可见 Prepared Plan Cache 的内存管理。
- 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
prepared-plan-cache.memory-guard-ratio
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
100
- 范围:
[1, 100000]
- 这个变量用来控制单个
SESSION
的 Prepared Plan Cache 最多能够缓存的计划数量,具体可见 Prepared Plan Cache 的内存管理。 - 在 v6.1.0 之前这个开关通过 TiDB 配置文件 (
prepared-plan-cache.capacity
) 进行配置,升级到 v6.1.0 时会自动继承原有设置。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[-1, 256]
- 这个变量用来设置
Projection
算子的并发度。 - 默认值
-1
表示使用tidb_executor_concurrency
的值。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
4096
(4 KiB) - 范围:
[0, 1073741824]
- 单位:字节
- 该变量控制 SQL 语句输出的最大长度。当一条 SQL 语句的输出长度大于
tidb_query_log_max_len
时,输出将会被截断。 - 在 v6.1.0 之前这个开关也可以通过 TiDB 配置文件 (
log.query-log-max-len
) 进行配置,升级到 v6.1.0 后仅可通过系统变量配置。
警告:
- 该特性与
replica-read
尚不兼容,开启tidb_rc_read_check_ts
的读请求无法使用replica-read
,请勿同时开启两项特性。- 如果客户端使用游标操作,建议不开启
tidb_rc_read_check_ts
这一特性,避免前一批返回数据已经被客户端使用而语句最终会报错的情况。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 该变量用于优化时间戳的获取,适用于悲观事务
READ-COMMITTED
隔离级别下读写冲突较少的场景,开启此变量可以避免获取全局 timestamp 带来的延迟和开销,并优化事务内读语句延迟。 - 如果读写冲突较为严重,开启此功能会增加额外开销和延迟,造成性能回退。更详细的说明,请参考读已提交隔离级别 (Read Committed) 文档。
- 作用域:SESSION
- 是否持久化到集群:否
- 类型:字符串
- 默认值:
strict
- 此变量用于控制自动提交的读语句的读一致性。
- 如果将变量值设置为
weak
,则直接跳过读语句遇到的锁,读的执行可能会更快,这就是弱一致性读模式。但在该模式下,事务语义(例如原子性)和分布式一致性(线性一致性)并不能得到保证。 - 如果用户场景中需要快速返回自动提交的读语句,并且可接受弱一致性的读取结果,则可以使用弱一致性读取模式。
- 作用域:SESSION
- 默认值:
0
- 范围
[-2147483648, 0]
- 这个变量用于设置当前会话允许读取的历史数据范围。设置后,TiDB 会从参数允许的范围内选出一个尽可能新的时间戳,并影响后继的所有读操作。比如,如果该变量的值设置为
-5
,TiDB 会在 5 秒时间范围内,保证 TiKV 拥有对应历史版本数据的情况下,选择尽可能新的一个时间戳。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
ON
- 这个变量用于控制是否在 slow log 里包含慢查询的执行计划。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制在记录 TiDB 日志和慢日志时,是否将 SQL 中的用户信息遮蔽。
- 将该变量设置为
1
即开启后,假设执行的 SQL 为insert into t values (1,2)
,在日志中记录的 SQL 会是insert into t values (?,?)
,即用户输入的信息被遮蔽。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用来控制优化器是否可以将包含 null 的等值条件作为前缀条件来访问索引。
- 该变量默认开启。开启后,该变量可以使优化器减少需要访问的索引数据量,从而提高查询的执行速度。例如,在有多列索引
index(a, b)
且查询条件为a<=>null and b=1
的情况下,优化器可以同时使用查询条件中的a<=>null
和b=1
进行索引访问。如果关闭该变量,因为a<=>null and b=1
包含 null 的等值条件,优化器不会使用b=1
进行索引访问。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:布尔值
- 默认值:
OFF
- 指定是否在子查询中移除
ORDER BY
子句。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
leader
-
可选值:
leader
,follower
,leader-and-follower
-
这个变量用于控制 TiDB 读取数据的位置,有以下三个选择:
- leader:只从 leader 节点读取
- follower:只从 follower 节点读取
- leader-and-follower:从 leader 或 follower 节点读取
更多细节,见 Follower Read。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
10
- 范围:
[-1, 9223372036854775807]
- 这个变量用来设置乐观事务的最大重试次数。一个事务执行中遇到可重试的错误(例如事务冲突、事务提交过慢或表结构变更)时,会根据该变量的设置进行重试。注意当
tidb_retry_limit = 0
时,也会禁用自动重试。该变量仅适用于乐观事务,不适用于悲观事务。
-
作用域:GLOBAL
-
是否持久化到集群:是
-
默认值:
2
-
范围:
[1, 2]
-
控制新保存数据的表数据格式版本。TiDB v4.0 中默认使用版本号为 2 的新表数据格式保存新数据。
-
但如果从 4.0.0 之前的版本升级到 4.0.0,不会改变表数据格式版本,TiDB 会继续使用版本为 1 的旧格式写入表中,即只有新创建的集群才会默认使用新表数据格式。
-
需要注意的是修改该变量不会对已保存的老数据产生影响,只会对修改变量后的新写入数据使用对应版本格式保存。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- TiDB 默认会在建表时为新表分裂 Region。开启该变量后,会在建表语句执行时,同步打散刚分裂出的 Region。适用于批量建表后紧接着批量写入数据,能让刚分裂出的 Region 先在 TiKV 分散而不用等待 PD 进行调度。为了保证后续批量写入数据的稳定性,建表语句会等待打散 Region 完成后再返回建表成功,建表语句执行时间会是该变量关闭时的数倍。
- 如果建表时设置了
SHARD_ROW_ID_BITS
和PRE_SPLIT_REGIONS
,建表成功后会均匀切分出指定数量的 Region。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
9223372036854775807
- 范围:
[1, 9223372036854775807]
- 该变量设置为
AUTO_RANDOM
或SHARD_ROW_ID_BITS
属性列分配的最大连续 ID 数。通常,AUTO_RANDOM
ID 或带有SHARD_ROW_ID_BITS
属性的行 ID 在一个事务中是增量和连续的。你可以使用该变量来解决大事务场景下的热点问题。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来设置是否校验 ASCII 字符的合法性。
- 校验 ASCII 字符会损耗些许性能。当你确认输入的字符串为有效的 ASCII 字符时,可以将其设置为
ON
。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 开启这个开关之后,如果对
tx_isolation
赋值一个 TiDB 不支持的隔离级别,不会报错,有助于兼容其他设置了(但不依赖于)不同隔离级别的应用。
tidb> set tx_isolation='serializable';
ERROR 8048 (HY000): The isolation level 'serializable' is not supported. Set tidb_skip_isolation_level_check=1 to skip this error
tidb> set tidb_skip_isolation_level_check=1;
Query OK, 0 rows affected (0.00 sec)
tidb> set tx_isolation='serializable';
Query OK, 0 rows affected, 1 warning (0.00 sec)
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来设置是否校验 UTF-8 字符的合法性。
- 校验 UTF-8 字符会损耗些许性能。当你确认输入的字符串为有效的 UTF-8 字符时,可以将其设置为
ON
。
注意:
跳过字符检查可能会使 TiDB 检测不到应用写入的非法 UTF-8 字符,进一步导致执行
ANALYZE
时解码错误,以及引入其他未知的编码问题。如果应用不能保证写入字符串的合法性,不建议跳过该检查。
- 作用域:GLOBAL
- 是否持久化到集群:否,仅作用于当前连接的 TiDB 实例
- 默认值:
300
- 范围:
[-1, 9223372036854775807]
- 单位:毫秒
- 输出慢日志的耗时阈值。当查询大于这个值,就会当做是一个慢查询,输出到慢查询日志。默认为 300 ms。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[-1, 256]
- TiFlash 中 request 执行的最大并发度。默认值为 -1,表示该系统变量无效。0 表示由 TiFlash 系统自动设置该值。
- 作用域:SESSION
- 默认值:""
- 查询
INFORMATION_SCHEMA.SLOW_QUERY
只会解析配置文件中slow-query-file
设置的慢日志文件名,默认是 "tidb-slow.log"。但如果想要解析其他的日志文件,可以通过设置 session 变量tidb_slow_query_file
为具体的文件路径,然后查询INFORMATION_SCHEMA.SLOW_QUERY
就会按照设置的路径去解析慢日志文件。更多详情可以参考 SLOW_QUERY 文档。
- 作用域:SESSION
- 默认值:""
- 这个变量用来设置当前会话期待读取的历史数据所处时刻。比如当设置为
"2017-11-11 20:20:20"
时或者一个 TSO 数字 "400036290571534337",当前会话将能读取到该时刻的数据。
警告:
该变量为实验特性,不推荐在生产环境中使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 这个变量用于控制 TiDB 内部统计信息缓存使用内存的上限。
警告:
统计信息同步加载目前为实验性特性,不建议在生产环境中使用。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 单位:毫秒
- 范围:
[0, 2147483647]
- 这个变量用于控制是否开启统计信息的同步加载模式(默认为
0
代表不开启,即为异步加载模式),以及开启的情况下,SQL 执行同步加载完整统计信息等待多久后会超时。更多信息,请参考统计信息的加载。
警告:
统计信息同步加载目前为实验性特性,不建议在生产环境中使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制统计信息同步加载超时后,SQL 是执行失败(
OFF
),还是退回使用 pseudo 的统计信息(ON
)。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
24
- 范围:
[0, 255]
- 这个变量设置了 statement summary tables 的历史记录容量。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用来控制是否在 statement summary tables 中包含 TiDB 内部 SQL 的信息。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
4096
- 范围:
[0, 2147483647]
- 这个变量控制 statement summary tables 显示的 SQL 字符串长度。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
3000
- 范围:
[1, 32767]
- 这个变量设置了 statement summary tables 在内存中保存的语句的最大数量。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
1800
- 范围:
[1, 2147483647]
- 单位:秒
- 这个变量设置了 statement summary tables 的刷新时间。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
5000
- 范围:
[1, 10000]
- 这个变量用于控制 Top SQL 每分钟最多收集 SQL 语句类型的数量。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
100
- 范围:
[1, 5000]
- 这个变量用于控制 Top SQL 每分钟保留消耗负载最大的前多少条 SQL(即 Top N) 的数据。
注意:
TiDB Dashboard 中的 Top SQL 页面目前只显示消耗负载最多的 5 类 SQL 查询,这与
tidb_top_sql_max_time_series_count
的配置无关。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 范围:
[0, 9223372036854775807]
- 这个变量用于限制 TiDB 同时向 TiKV 发送的请求的最大数量,0 表示没有限制。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
OFF
- 这个变量用于控制
SYSDATE
函数能否替换为NOW
函数,其效果与 MYSQL 中的sysdate-is-now
一致。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
3
- 范围:
[1, 10]
- 单位:秒
- 这个变量用来控制缓存表的 lease 时间,默认值是 3 秒。该变量值的大小会影响缓存表的修改。在缓存表上执行修改操作后,最长可能出现
tidb_table_cache_lease
变量值时长的等待。如果业务表为只读表,或者能接受很高的写入延迟,则可以将该变量值调大,从而增加缓存的有效时间,减少 lease 续租的频率。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
67108864
- 范围:
[1048576, 137438953472]
- 单位:字节
- 这个变量用于限制单个临时表的最大大小,临时表超出该大小后报错。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 类型:布尔值
- 默认值:
ON
- 本变量控制 TiDB 是否跟踪聚合函数的内存使用情况。
警告:
如果禁用该变量,TiDB 可能无法准确跟踪内存使用情况,并且无法控制对应 SQL 语句的内存使用。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
0
- 范围:
[0, 10]
- 单位:毫秒
- 这个变量用来设置 TiDB 向 PD 请求 TSO 时进行一次攒批操作的最大等待时长。默认值为
0
,即不进行额外的等待。 - 在向 PD 获取 TSO 请求时,TiDB 使用的 PD Client 会一次尽可能多地收集同一时刻的 TSO 请求,将其攒批合并成一个 RPC 请求后再发送给 PD,从而减轻 PD 的压力。
- 将这个变量值设置为非 0 后,TiDB 会在每一次攒批结束前进行一个最大时长为其值的等待,目的是为了收集到更多的 TSO 请求,从而提高攒批效果。
- 适合调高这个变量值的场景:
- PD leader 因高压力的 TSO 请求而达到 CPU 瓶颈,导致 TSO RPC 请求的延迟较高。
- 集群中 TiDB 实例的数量不多,但每一台 TiDB 实例上的并发量较高。
- 在实际使用中,推荐将该变量尽可能设置为一个较小的值。
注意:
如果 PD leader 的 TSO RPC 延迟升高,但其现象并非由 CPU 使用率达到瓶颈而导致(可能存在网络等问题),此时,调高
tidb_tso_client_batch_max_wait_time
可能会导致 TiDB 的语句执行延迟上升,影响集群的 QPS 表现。
-
作用域:SESSION | GLOBAL
-
是否持久化到集群:是
-
默认值:
FAST
-
可选值:
OFF
,FAST
,STRICT
-
这个变量用于设置 assertion 级别。assertion 是一项在事务提交过程中进行的数据索引一致性校验,它对正在写入的 key 是否存在进行检查。如果不符则说明数据索引不一致,会导致事务 abort。详见数据索引一致性报错。
-
对于新创建的 v6.0.0 及以上的集群,默认值为
FAST
。对于升级版本的集群,如果升级前是低于 v6.0.0 的版本,升级后默认值为OFF
。OFF
: 关闭该检查。FAST
: 开启大多数检查项,对性能几乎无影响。STRICT
: 开启全部检查项,当系统负载较高时,对悲观事务的性能有较小影响。
- 作用域:GLOBAL
- 是否持久化到集群:是
- 默认值:
16384
- 范围:
[1, 1073741824]
- 单位:字节
- 这个变量用于控制 TiDB 向 TiKV 发送的事务提交请求的批量大小。如果业务负载的大部分事务都有大量的写操作,适当调大该变量可以提高批处理的效果。但需要注意的是,设置过大将会超过 TiKV 的
raft-entry-max-size
限制,导致提交失败。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
pessimistic
- 可选值:
pessimistic
,optimistic
- 这个变量用于设置事务模式。TiDB v3.0 支持了悲观事务,自 v3.0.8 开始,默认使用悲观事务模式。
- 但如果从 3.0.7 及之前的版本升级到 >= 3.0.8 的版本,不会改变默认事务模式,即只有新创建的集群才会默认使用悲观事务模式。
- 将该变量设置为 "optimistic" 或 "" 时,将会使用乐观事务模式。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制是否开启执行计划绑定功能,默认打开,可通过赋值
OFF
来关闭。关于执行计划绑定功能的使用可以参考执行计划绑定文档。
- 作用域:SESSION
- 默认值:
ON
- 由于打散 Region 的时间可能比较长,主要由 PD 调度以及 TiKV 的负载情况所决定。这个变量用来设置在执行
SPLIT REGION
语句时,是否同步等待所有 Region 都打散完成后再返回结果给客户端。- 默认
ON
代表等待打散完成后再返回结果 OFF
代表不等待 Region 打散完成就返回。
- 默认
- 需要注意的是,在 Region 打散期间,对正在打散 Region 上的写入和读取的性能会有一定影响,对于批量写入、导数据等场景,还是建议等待 Region 打散完成后再开始导数据。
- 作用域:SESSION
- 默认值:
300
- 范围:
[1, 2147483647]
- 单位:秒
- 这个变量用来设置
SPLIT REGION
语句的执行超时时间,默认值是 300 秒,如果超时还未完成,就返回一个超时错误。
警告:
从 v5.0 版本开始,该变量被废弃。请使用
tidb_executor_concurrency
进行设置。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
-1
- 范围:
[1, 256]
- 这个变量用于设置 window 算子的并行度。
- 默认值
-1
表示使用tidb_executor_concurrency
的值。
- 作用域:SESSION | GLOBAL
- 默认值:
8192
- 范围:
[1, 18446744073709551616]
- 细粒度 shuffle 功能开启时,下推到 TiFlash 的窗口函数可以并行执行。该变量控制发送端发送数据的攒批大小,即发送端累计行数超过该值就会进行一次数据发送。
- 对性能影响:如果该值设置过小,例如极端值 1 ,会导致每个 Block 都进行一次网络传输。如果设置过大,例如极端值整个表的行数,会导致接收端大部分时间都在等待数据,无法流水线计算。可以观察 TiFlash 接收端收到的行数分布情况,如果大部分线程接收的行数很少,例如只有几百行,可以增加该值以达到减少网络开销的目的。
-
作用域:SESSION | GLOBAL
-
默认值:
0
-
范围:
[-1, 1024]
-
当窗口函数下推到 TiFlash 执行时,可以通过该变量控制窗口函数执行的并行度。不同取值含义:
- -1: 表示不使用细粒度 shuffle 功能,下推到 TiFlash 的窗口函数以单线程方式执行
- 0: 表示使用细粒度 shuffle 功能。如果
tidb_max_tiflash_threads
有效(大于 0),则tiflash_fine_grained_shuffle_stream_count
会自动取值为tidb_max_tiflash_threads
,否则为默认值 8 。最终在 TiFlash 上窗口函数的实际并发度为:min(tiflash_fine_grained_shuffle_stream_count
,TiFlash 节点物理线程数) - 大于 0: 表示使用细粒度 shuffle 功能,下推到 TiFlash 的窗口函数会以多线程方式执行,并发度为: min(
tiflash_fine_grained_shuffle_stream_count
, TiFlash 节点物理线程数)
-
理论上窗口函数的性能会随着该值的增加线性提升。但是如果设置的值超过实际的物理线程数,反而会导致性能下降。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
SYSTEM
- 数据库所使用的时区。这个变量值可以写成时区偏移的形式,如 '-8:00',也可以写成一个命名时区,如 'America/Los_Angeles'。
- 默认值
SYSTEM
表示时区应当与系统主机的时区相同。系统的时区可通过system_time_zone
获取。
- 作用域:SESSION
- 默认值:
0
- 一个 Unix 时间戳。变量值非空时,表示
CURRENT_TIMESTAMP()
、NOW()
等函数的时间戳。该变量通常用于数据恢复或数据复制。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
REPEATABLE-READ
- 可选值:
READ-UNCOMMITTED
,READ-COMMITTED
,REPEATABLE-READ
,SERIALIZABLE
- 这个变量用于设置事务隔离级别。TiDB 为了兼容 MySQL,支持可重复读 (
REPEATABLE-READ
),但实际的隔离级别是快照隔离。详情见事务隔离级别。
这个变量是 transaction_isolation
的别名。
- 作用域:NONE
- 默认值:
5.7.25-TiDB-(tidb version)
- 这个变量的值是 MySQL 的版本和 TiDB 的版本,例如 '5.7.25-TiDB-v4.0.0-beta.2-716-g25e003253'。
- 作用域:NONE
- 默认值:(string)
- 这个变量的值是 TiDB 版本号的其他信息,例如 'TiDB Server (Apache License 2.0) Community Edition, MySQL 5.7 compatible'。
- 作用域:NONE
- 默认值:(string)
- 这个变量值是 TiDB 所在操作系统的名称。
- 作用域:NONE
- 默认值:(string)
- 这个变量值是运行 TiDB 的 CPU 架构的名称。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
28800
- 范围:
[0, 31536000]
- 单位:秒
- 这个变量表示用户会话的空闲超时。
0
代表没有时间限制。
- 作用域:SESSION
- 默认值:
0
- 这个只读变量表示之前执行语句中出现的警告数。
- 作用域:SESSION | GLOBAL
- 是否持久化到集群:是
- 默认值:
ON
- 这个变量用于控制计算窗口函数时是否采用高精度模式。