Unicode是支持最广的,这就意味着我们可以作为一个中间体来转换。多种字符集都是可互相转的,很简单。 https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/ func main() { var s = "中国 ...
分类:
其他好文 时间:
2020-04-22 20:04:47
阅读次数:
93
#####集合######由不同元素组成,集合中的元素都是无序的,集合中的元素必须全为不可变类型#不可变类型有:字符串、数字、字符、元祖s = {1,2,3,4,5,6,1,3,5}print(s)s = set('hello')print(s)d = set (['hello','nihao',' ...
分类:
编程语言 时间:
2020-04-22 09:55:47
阅读次数:
94
[TOC] 引言 一直以来总是对 unicode, UTF-8 等编码知识懵懵懂懂的,尤其是在做项目过程中只要涉及到几个编码之间的转换,都得到网上搜索一番,根据别人的经验照葫芦画瓢,才能解决问题,但是私底下却完全不懂在做什么。 我再也不愿意重复这种状态了,于是就花了一个上午的时间,将这些知识整理了一 ...
分类:
其他好文 时间:
2020-04-20 13:54:03
阅读次数:
62
今天的内容其实可以总结一句话就是 用python3就屁事没有 由于结论相对过程重要 就列在前头 结论: 1、内存固定使用unicode,我们可以改变的是存入硬盘采用格式英文+汉字-》unicode-》gbk英文+日文-》unicode-》shift-jis万国字符》-unicode-》utf-8 2 ...
分类:
其他好文 时间:
2020-04-19 00:47:25
阅读次数:
124
参考文章:https://blog.csdn.net/yanghuan313/article/details/63262477 python编码:encode() 将Unicode字符按照编码规则(如UTF-8)编成字节序列。 >>> a = u"测试">>> a.encode("UTF-8")'\ ...
分类:
编程语言 时间:
2020-04-18 22:35:34
阅读次数:
81
使用正则匹配时,虽然正则没报错,但发出了一个警告: 根据这篇文章《Python正则表达式报错:invalid escape sequence '\d' (无效的转义字符'\d')》,原因是Python3将字符串解释为Unicode字符串,因为正则中的\D或者\*就被视为转义的Unicode字符,解决 ...
分类:
其他好文 时间:
2020-04-18 14:11:59
阅读次数:
711
package main import ( "fmt" "strconv" "unicode/utf8" ) func main() { ascii := "abc我爱中华人民共和国" fmt.Println([]byte(ascii)) fmt.Println([]rune(ascii)) fmt ...
分类:
编程语言 时间:
2020-04-18 00:02:19
阅读次数:
110
问题:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd 原因:文件里面存在非'utf-8'编码的字符,比如其他平台上写入的中文字符 解决:尝试其他解码格式 import codecs with codecs.open(fname, 'r ...
分类:
其他好文 时间:
2020-04-17 12:30:56
阅读次数:
74
1.清理环境 ①关闭防火墙和selinux ②清理已安装的数据库 2.下载二进制包 "下载地址" 3.安装MySQL5.7 ①解压并安装依赖 ②初始化并设置环境变量 ③配置MySQL ④将MySQL添加到系统服务 ⑤启动服务 ⑥修改root密码 参考博客: https://www.pingface. ...
分类:
数据库 时间:
2020-04-16 09:14:35
阅读次数:
78
在学习python从文件中读取文件,并将文件中的字符串转化为列表的时候,发现文件头多了一个\ufeff字符。 这个问题前段时间也遇到过了,同样是上网搜索了半天才解决,当时只是把问题解决就过去了,但是今天遇到同样的问题时,知道有这么一个解决方法,但是怎么做就是想不起来。古人云,好记性不如烂笔头,一点没 ...
分类:
其他好文 时间:
2020-04-14 23:00:13
阅读次数:
88