1 概念 字符 Character 各种【文字】和【符号】的总称,包括:各国文字、标点符号、图形符号、数字等 字符集 Character Set 多个【字符的集合】,字符集种类较多,每个字符集包含的字符、字符个数均不同。 常见的字符集名称:ASCII字符集、Big5(中文最早的编码表/字符集)、GB ...
分类:
其他好文 时间:
2020-07-19 17:53:54
阅读次数:
83
##无论是编码后还是解码后,都是一串字节。 ###通用语言 编码,解码,必须至少要有一种共同的语言,也就是共同的编码方式,这个通用语言(也是一种字符编码)即是 Unicode 接下来所谓的编码,解码。 ###编码 将通用语言(Unicode编码)表示的字符(串)重新按另一种编码表示,生成另外一组字节 ...
分类:
其他好文 时间:
2020-07-12 22:19:44
阅读次数:
61
键盘uniCode编码 功能键: 8 ==> Backspace 9 ==> Tab 12==> Clear 13==> Enter 16==> Shift 17==> Control 18==> Alt 20==> Caps Lock 27==> Esc 32==> Spacebar 33==> ...
分类:
其他好文 时间:
2020-07-03 19:49:44
阅读次数:
228
除了0、1这些阿拉伯数字,像a、b、c这样的52个字母(包括大小写),还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,理论上每个人都可以有自己的一套规则(这就叫编码规则,形成编码表)。 ...
分类:
编程语言 时间:
2020-05-31 01:17:51
阅读次数:
164
一、转换流 1.1 OutputStreamWriter类 查阅OutputStreamWriter的API介绍,OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的字符编码表,将要写入流中的字符编码成字节。它的作用的就是,将字符串按照指定的编码表转成字节,在使用字节流将这些 ...
分类:
编程语言 时间:
2020-05-26 22:08:45
阅读次数:
74
"常用编码格式" [TOC] "Base64" Base64编码表, 记为$\mathbb{E}$: 编码方式: 记有一串二进制数据作为输入数据(字节长度记为$l$), 按输入顺序每3个字节分为一组(不足3个字节的组末尾填充 补齐到三字节), 每组数据记为$\upsilon_i,\ i=[0, (l ...
分类:
其他好文 时间:
2020-05-24 13:57:25
阅读次数:
74
ALBERT论文:https://arxiv.org/pdf/1909.11942.pdf 英文原文:https://amitness.com/2020/02/albert visual summary/ 译文链接:https://www.6aiq.com/article/1589833968655 ...
分类:
其他好文 时间:
2020-05-23 18:32:26
阅读次数:
74
数据结构第五章学习小结 5.1-5.4 5.1 树和二叉树的定义 5.1.1 树的定义 树是n个结点的有限集,它或为空树,或为非空树 对于非空树T: (1)有且仅有一个称之为根的结点; (2)除根结点以外的其余结点可分为 m个互不相交的有限集 T1, T2 , …,Tm,其中每一个集合本身又是一棵树 ...
分类:
其他好文 时间:
2020-05-22 00:01:17
阅读次数:
56
8位编码表示一个字符 欧洲人使用电脑后,扩展了字符集 16位能表示的汉字就多了 为什么高8位和低8位要加A0(160),因为这样保证了高8位和低8位都>127,这样计算机就能区分GB2313码和ASCII码了,这样在解码的时候遇到连续两个>127的8位,就会解析成一个汉字 由于6763个汉字不够用, ...
分类:
其他好文 时间:
2020-05-05 23:42:14
阅读次数:
88
一、File类的使用 1. File类的理解 File类的一个对象,代表一个文件或一个文件目录(俗称:文件夹)。 防城港SEO(网站优化) File类声明在java.io包下:文件和文件路径的抽象表示形式,与平台无关。 File类中涉及到关于文件或文件目录的创建、删除、重命名、修改时间、文件大小等方 ...
分类:
编程语言 时间:
2020-05-05 00:22:29
阅读次数:
71