分布式系统预备知识-全公司唯一单据编号生成方法


摘要:
下文讲述大型互联网系统中全公司唯一单据编号详解,
下文将从大型互联网公司的唯一单据编号功能及同唯一列的不同之处及实现方式进行“全公司唯一单据编号”进行详解说明
如下所示:


1.常见的单据编号用途:

1.在互联网项目中,处处都有全局唯一单据编号存在,例:
淘宝订单号:全taobao唯一
支付宝付款流水号:全支付宝唯一
微信支付交易单号 等等这些大型互联网系统都拥有单据编号;
 编号在大型互联网系统中的作用就标识这条交易的唯一性。
2.在企业内部的ERP中,每一个业务记录的产生都对应的单号信息,例:
   入库单会生成入库单号
   销售单会生成销售单号
   采购退货单会生成相应的退后单号
   销售退货单也会生成相应的销售退货单号,等等
   这些业务单号在企业内部可以作为此业务的唯一标识。
那么从以上的两个业务我们可以得出,单据编号的用途就是业务的唯一标识

唯一标识和单据编号的区别

唯一标识:常指一个数据表的唯一行记录的标识列;
单据编号:是针对一项业务进行标识。
————————-
唯一标识:不具备一些业务属性,无法用作其它用途,只可以作为数据库的唯一标识信息
单据编号:具有一定的业务属性。

3.分布式系统为何需要单据开发一个全局编号生成接口

3.1 因为一个系统中,需要生成编号的地方非常多非常多,为了避免重复造轮子,我们需要采用一个单独的单据编号生成程序。
3.2 一个分布式系统,一个模块可能由成千上万不同的程序生成单据编号,所以必须使用一个单据的编号生成接口,使生成的单据编号安全可靠。


4.分布式系统为何需要单据开发一个全局编号生成接口

4.1 前缀列(或前缀列+日期)+数据库自增列
这种方式的最大弊端就是依赖数据库,不利用数据库的扩展,而且自增列有一定的“上线”会达到最大值,这种自增列不具备业务属性,
这种自增列由于具有一定的规律,所有有经验的用户,可以估算出系统的业务量,变相的泄露了公司的业务信息。

4.2 前缀列+机器Id+ 序列号(毫秒级时间41位+机器ID 10位+毫秒内序列12位)
采用4.2的方式,可以保证编号的唯一性,也就是大家常说的 Snowflake 算法,
采用此种方式生成编号的缺点就是订单号位数过长,但是可以保证其唯一性,此种生成编号的方法,目前被N多大型互联网公司采用,
采用此种方式的最大优点就是脱离于编号生成完全脱离数据库,这种方式便于数据库的移植和程序的移植。

通过以上方式,我们可以总结出,最利于业务表达的单据编号生成方式为”4.2″,而且这种方式,也利于分库分表的扩展。