码迷,mamicode.com
首页 > 编程语言 > 详细

python 随机生成汉字

时间:2020-03-03 10:37:21      阅读:245      评论:0      收藏:0      [点我收藏+]

标签:col   utf-8   详细   组合   www   问题   str   两种方法   src   

第一种方法:Unicode码

在unicode码中,汉字的范围是(0x4E00, 9FBF)

这个方法比较简单,但是有个小问题,unicode码中收录了2万多个汉字,包含很多生僻的繁体字.

第二种方法:GBK2312

gbk2312对字符的编码采用两个字节相组合,第一个字节的范围是0xB0-0xF7, 第二个字节的范围是0xA1-0xFE.
对GBK2312编码方式详细的解释请参看GBK2312编码

GBK2312收录了6千多常用汉字.两种方法的取舍就看需求了.

import random

def Unicode():
    val = random.randint(0x4e00, 0x9fbf)
    return chr(val)

def GBK2312():
    head = random.randint(0xb0, 0xf7)
    body = random.randint(0xa1, 0xfe)
    val = f{head:x} {body:x}
    str = bytes.fromhex(val).decode(gb2312)
    return str

if __name__ == __main__:
    print(Unicode())
    print(GBK2312())

技术图片

第三种方法:列表读取

# encoding: utf-8
import random

first_name = ["", "", "", "", "", "", "", "", "", "", "", "", "", "", "上官", "", ""]
second_name = ["", "", "建国", "", "", "万里", "爱民", "", "", "", "", "", "", "", "志宏", "", "", "", "","明浩", "", "", "", ""]
name = random.choice(first_name) + random.choice(second_name)

print(name)

 

python 随机生成汉字

标签:col   utf-8   详细   组合   www   问题   str   两种方法   src   

原文地址:https://www.cnblogs.com/xioawu-blog/p/12400582.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!