一、字符集的概念1、字符编码(characterencoding):字符编码是一种法则,在数字与符号之间建立的对应关系。不同的国家有不同的语言,包含的文字、标点符号、图形符号各有不同。例如在ASCII编码中,用数字97表达字符‘a‘与字符集相对应,常见的字符编码有ASCII,GBK,GB18030,Unicode等。2、字符集(Characterset)字符集是字符的集合,字符是文
分类:
数据库 时间:
2020-04-25 10:56:34
阅读次数:
122
1、Java基本数据类型包括4种整型,2种浮点数类型,1种表示Unicode编码字符单元的字符类型char和1种表示真值的boolean类型。 2、其中占用内存8位的是byte和boolean,16位的是short和char,32位的是int和float,64位的是double和long。 3、每种 ...
分类:
编程语言 时间:
2020-04-24 01:19:43
阅读次数:
128
这个解析库对于学过前端的人非常友好,因为其有强大的CSS选择器,也可以增加或删除class,方便的提取数据或者属性。 初始化 字符串初始化 这个就是传入html代码的字符串格式,简单的requests库可以获得该参数。 以知乎 新闻页为例 r.text返回的是一个经过解码后的字符串,是unicode ...
分类:
编程语言 时间:
2020-04-24 01:01:23
阅读次数:
81
这章讲了JavaScript的语法、数据类型、流控制语句和函数。理解还是挺好理解的,但有很多和C、C++、Java不同的地方需要记忆。比如, JavaScript标识符可以由Unicode字符字符组成。 JavaScript每条语句后面的分号也不是必需的,语句后面没有分号时,解析器会自己确定语句的结 ...
分类:
编程语言 时间:
2020-04-23 18:53:43
阅读次数:
66
重要: TRIM 函数专用于剪裁文本中的 7 位 ASCII 空格字符(值 32)。 在 Unicode 字符集中,存在名为不间断空格字符的附加空格字符,其十进制值为 160。 通常在网页中使用此字符作为 HTML 实体 。 TRIM 函数本身不会删除此不间断空格字符。 有关如何从文本中 ...
分类:
编程语言 时间:
2020-04-23 00:36:02
阅读次数:
161
一、字符编码和字符集1、字符编码(characterencoding):字符编码是一种法则,在数字与符号之间建立的对应关系。不同的国家有不同的语言,包含的文字、标点符号、图形符号各有不同。例如在ASCII编码中,用数字97表达字符‘a‘与字符集相对应,常见的字符编码有ASCII,GBK,GB18030,Unicode等。2、字符集(Characterset)字符集是字符的集合,字符
分类:
其他好文 时间:
2020-04-23 00:14:48
阅读次数:
177
Unicode是支持最广的,这就意味着我们可以作为一个中间体来转换。多种字符集都是可互相转的,很简单。 https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/ func main() { var s = "中国 ...
分类:
其他好文 时间:
2020-04-22 20:04:47
阅读次数:
93
#####集合######由不同元素组成,集合中的元素都是无序的,集合中的元素必须全为不可变类型#不可变类型有:字符串、数字、字符、元祖s = {1,2,3,4,5,6,1,3,5}print(s)s = set('hello')print(s)d = set (['hello','nihao',' ...
分类:
编程语言 时间:
2020-04-22 09:55:47
阅读次数:
94
[TOC] 引言 一直以来总是对 unicode, UTF-8 等编码知识懵懵懂懂的,尤其是在做项目过程中只要涉及到几个编码之间的转换,都得到网上搜索一番,根据别人的经验照葫芦画瓢,才能解决问题,但是私底下却完全不懂在做什么。 我再也不愿意重复这种状态了,于是就花了一个上午的时间,将这些知识整理了一 ...
分类:
其他好文 时间:
2020-04-20 13:54:03
阅读次数:
62
今天的内容其实可以总结一句话就是 用python3就屁事没有 由于结论相对过程重要 就列在前头 结论: 1、内存固定使用unicode,我们可以改变的是存入硬盘采用格式英文+汉字-》unicode-》gbk英文+日文-》unicode-》shift-jis万国字符》-unicode-》utf-8 2 ...
分类:
其他好文 时间:
2020-04-19 00:47:25
阅读次数:
124