【杂谈】主键ID如何选择——自增数 OR UUID？

来源：cnblogs　　作者：猫毛·波拿巴　　时间：2025/2/20 10:39:12　　对本文有异议

1.生成位置如何影响选择？

数据库往返时间

使用自增数时，ID是由数据库在执行INSERT操作时生成的；而UUID则可以在应用层生成。

考虑这样的场景：

一个方法需要插入A和B两个实体。其中B的数据需要引用A的ID。

如果使用自增ID，则必须与数据库进行两次网络请求：

1.先插入A，获取A的ID；

2.然后使用A的ID构建B，再插入B。

而如果使用UUID，可以在应用层同时生成A和B的ID，之后一次性将两个实体提交给数据库，从而减少网络往返的次数，提高效率。

ID冲突

自增数在一个表内不会冲突，那两个表呢？

当业务发展到需要分库分表的时候，就不能再使用自增数作为ID了，因为两个库/表会生成相同的ID。这种ID冲突且不报错的问题，会导致数据混乱。

UUID虽然具有全球唯一性，极端情况也会有冲突，所以应用层需要想办法处理，确保ID唯一性，例如IID生成结合机器ID。

2.有序与无序如何影响选择？

ID是否有序对数据库性能有重要影响，特别是使用B-Tree索引。

有序的ID：对B-Tree索引来说，键值有序，那么连续插入的数据都会一个或少数几个节点上，这意味着，数据库只需要对少量的物理块进行I/O读写，I/O范围小，性能较好。

eg：连续插入20条数据，都在一个节点上，只要加载一个物理块。

无序的ID：键值无序，那么连续插入的数据可能随机分布在各个节点上，数据库就需要对大量的物理块进行I/O读写，性能较差。

eg：连续插入20条数据，经计算它们分布在20个不同节点上，需要加载20个物理块。

显然，自增ID是有序的，所以在大多数情况下，它的性能优于无序的UUID。

值得一提的是，UUID也有多个版本，其中一些是有序的，例如UUIDv7和雪花算法（Snowflake）

而Java JDK默认使用的UUID是v4版本，是无序的。

3.ID大小如何影响选择？

ID大小指占用的存储空间。自增数通常是INT或BIGINT，分别是4字节和8字节。UUID一般由32个字符组成，占16字节。

树的高度

在B-Tree中，对于固定大小的节点，键值大小会影响一个节点能存储的键值数量（这里就是ID数量）。影响了单个节点存储的键值，就会影响节点数量，进而影响树的高度。

而树越高，一次查询需要访问的节点就更多，查询就更慢。

内存开销

相同数量的记录，ID的大小会影响到数据库引擎的缓存（索引和数据行）。同样大小的缓存空间，单个ID越大，能缓存的数据就越少。

例如：InnoDB使用innodb_buffer_pool_size控制缓存池大小

总结

总的来说，有序的UUID（UUIDv7，雪花算法）更适合分布式服务，自增ID更适合单机服务。

但是也要看具体业务，举个例子，如果分表的数据不存在跨表访问的情况，那么ID冲突就冲突了，没有任何影响。

而且，ID策略也能混着用，一个数据库里面不同表可以用不同的ID生成策略。

原文链接：https://www.cnblogs.com/longfurcat/p/18724563

友情链接：直通硅谷　点职佳　北美留学生论坛

编程经验热门文章

Prometheus监控之SNMP Exporter介绍和数据展现

Intel 82599网卡异常挂死原因

腾讯防水墙的分析识别与破解

桌面应用自动化WinAppDriver入门

文档在线预览（三）使用js前端实现word、excel、pdf、ppt 在线预览

「教程」如何下载AcFun网站上的视频、A站视频下载工具

基于Hi3559AV100的SVP(NNIE)开发整体流程

GBDT(梯度提升树)scikit-klearn中的参数说明及简汇

antd之RangePicker设置默认值方式

决胜经典算法之插入排序

编程经验推荐文章

为什么Raft算法是分布式系统的首选？

wifi基础(一)：无线电波与WIFI信号干扰、衰减

甲方扔给两个存在包名与类名均相同的Jar包，要在工程中同时使用怎么办？

《花100块做个摸鱼小网站! 》第三篇—热搜表结构设计和热搜数据存储

Fluent Editor：一个基于 Quill 2.0 的富文本编辑器，功能强大、开箱即用！

方法的三种调用形式

《花100块做个摸鱼小网站! 》第二篇—后端应用搭建和完成第一个爬虫

《熬夜整理》保姆级系列教程-玩转Wireshark抓包神器教程(4)-再识Wireshark - 北京-宏哥

《软件性能测试分析与调优实践之路》(第2版) 读书笔记（二）总体介绍（下）-真正从性能分析与调优来看性能测试

架构知识点（三）