VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > Python基础教程 >
  • Python3标准库:uuid 全局唯一标识符

1. uuid 全局唯一标识符

uuid 模块实现了全局唯一标识符(Universally Unique Identifier);这个RFC定义了一个系统,可以为资源创建唯一的标识符,这里采用一种不需要集中注册机的方式。UUID值为128位,正如参考指南所述,“UUID可以保证跨空间和时间的唯一性”。对于文档、主机、应用客户以及其他需要唯一值的情况,UUID可以用来生成标识符。这个RFC特别强调创建一个统一资源名(Uniform Resource Name)命名空间,并且涵盖了3个主要算法。

  • 使用IEEE802MAC地址作为唯一性来源
  • 使用伪随机数
  • 使用公开的串并结合密码散列

在上述所有情况下,种子值都要与系统时钟结合,如果向后设置时钟,则要用一个时钟序列值维护唯一性。

1.1 UUID1: IEEE 802 MAC地址

UUID1值使用主机的MAC地址计算。uuid模块使用getnode()来获取当前系统的MAC值。


  1. import uuid
  2.  
  3. print(hex(uuid.getnode()))

如果一个系统有多个网卡,那么相应地便会有多个MAC地址,并且可能返回其中任意一个值。

要为一个主机(由其MAC地址标识)生成一个UUID,需要使用uuid1()函数。节点标识符参数是可选的;如果没有设置这个域,那么便会使用getnode()返回的值。


  1. import uuid
  2.  
  3. u = uuid.uuid1()
  4.  
  5. print(u)
  6. print(type(u))
  7. print('bytes :', repr(u.bytes))
  8. print('hex :', u.hex)
  9. print('int :', u.int)
  10. print('urn :', u.urn)
  11. print('variant :', u.variant)
  12. print('version :', u.version)
  13. print('fields :', u.fields)
  14. print(' time_low : ', u.time_low)
  15. print(' time_mid : ', u.time_mid)
  16. print(' time_hi_version : ', u.time_hi_version)
  17. print(' clock_seq_hi_variant: ', u.clock_seq_hi_variant)
  18. print(' clock_seq_low : ', u.clock_seq_low)
  19. print(' node : ', u.node)
  20. print(' time : ', u.time)
  21. print(' clock_seq : ', u.clock_seq)

对于返回的UUID对象,可以通过只读的实例属性访问它的各个部分。有些属性是UUID值的不同表示,如hex、int和urn。

由于有时间分量(time),所以每次调用uuid1()都会返回一个新值。


  1. import uuid
  2.  
  3. for i in range(3):
  4. print(uuid.uuid1())

在这个输出中,只有时间分量(串的开始部分)有变化。

由于每个计算机有不同的MAC地址,所以在不同系统上运行这个示例程序会生成完全不同的值。下一个例子传递不同的节点ID来模拟在不同主机上运行。


  1. import uuid
  2.  
  3. for node in [0x1ec200d9e0, 0x1e5274040e]:
  4. print(uuid.uuid1(node), hex(node))

除了返回不同的时间值,UUID末尾的节点标识符也有变化。

1.2 UUID 3和5 基于名字的值

有些情况下可能需要根据名字创建UUID值,而不是根据随机值或基于时间的值来创建。UUID3和5规范使用密码散列值(分别使用MD5或SHA-1),将特定于命名空间的种子值与名字相结合。有一些由预定义UUID值标识的公开的命名空间,分别用于处理DNS、URL、ISO OID和X.500识别名(Distinguished Name)。通过生成和保存UUID值,还可以定义新的特定于应用的命名空间。


  1. import uuid
  2.  
  3. hostnames = ['www.doughellmann.com', 'blog.doughellmann.com']
  4.  
  5. for name in hostnames:
  6. print(name)
  7. print(' MD5 :', uuid.uuid3(uuid.NAMESPACE_DNS, name))
  8. print(' SHA-1 :', uuid.uuid5(uuid.NAMESPACE_DNS, name))
  9. print()

要从一个DNS名创建UUID,可以把uuid.NAMESPACE_DNS作为命名空间参数传入uuid3()或uuid5()。

不论什么时间计算或者在哪里计算,一个命名空间中给定名的UUID值总是相同的。


  1. import uuid
  2.  
  3. namespace_types = sorted(
  4. n
  5. for n in dir(uuid)
  6. if n.startswith('NAMESPACE_')
  7. )
  8. name = 'www.doughellmann.com'
  9.  
  10. for namespace_type in namespace_types:
  11. print(namespace_type)
  12. namespace_uuid = getattr(uuid, namespace_type)
  13. print(' ', uuid.uuid3(namespace_uuid, name))
  14. print(' ', uuid.uuid3(namespace_uuid, name))
  15. print()

但是命名空间中相同名字的UUID值则是不同的。

1.3 UUID 4 随机数

有时,基于主机和基于命名空间的UUID值“差别还不够大”。例如,如果UUID要作为散列键,则需要有区分度更大、更随机的值序列来避免散列表中出现冲突。让值有更少的共同数字也能更容易地在日志文件中查找这些值。为了增加UUID的区分度,可以使用uuid4()利用随机的输入值生成UUID。


  1. import uuid
  2.  
  3. for i in range(3):
  4. print(uuid.uuid4())