码迷,mamicode.com
首页 > 其他好文 > 详细

Hive中生成随机唯一标识ID的方法

时间:2021-06-21 20:24:19      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:reflect   sele   exp   reg   body   系统   分布式   随即数   scss   

HIVE中处理的数据往往比较多,在处理数据的时候希望给处理得到的数据一个ID标识,这时候可以用到UUID。

UUID的算法的核心思想是结合机器的网卡、当地时间、一个随即数来生成UUID。从理论上讲,如果一台机器每秒产生10000000个UUID,则可以保证(概率意义上)3240年不重复。UUID 的目的,是让分布式系统中的所有元素,都能有唯一的标识,而不需要透过中央控制端来做标识。如此一来,每个人都可以建立不与其它人冲突的UUID。在这样的情况下,就不需考虑数据标识建立时的名称重复问题。

产生形如下数据: 
690044a7-1400-4f2e-8003-4df850f21ac2 
0eea4f29-6e80-4d8e-a7ce-5d4ea5f0e882 
869d23f8-fe44-4d71-9c5b-3d94b1892f48

在HQL中可以这么写:

regexp_replace(reflect("java.util.UUID", "randomUUID"), "-", "")

将其中的‘-’清除掉,得到所要的唯一ID。缺点就是比较长。

Hive中生成随机唯一标识ID的方法

标签:reflect   sele   exp   reg   body   系统   分布式   随即数   scss   

原文地址:https://www.cnblogs.com/javalinux/p/14911071.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!