ASCII码大致由三部分组成: 1、ASCII 打印字符:数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现。注:十进制32代表空格 ,十进制数字 127 代表 DELETE 命令。下面是ASCII码和相应数字的对照表 2、ASCII 非打印控制字符:ASCII 表上的数 ...
分类:
其他好文 时间:
2017-08-20 19:46:23
阅读次数:
170
字符编码: 2.0下默认是ascii码,不能支持中文,所以中国有GB2312 GBK UTF-8 utf-8是unicode(万国编码)的扩展集 GBK向下兼容GB2312 windows默认的编码是GBK unicode不管存英文还是存中文,都是两个字节 acciss默认英文是一个字节, utf- ...
分类:
其他好文 时间:
2017-08-17 22:52:26
阅读次数:
247
ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符。标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:0~31及127(共33个)是控制字符或通信专..
分类:
其他好文 时间:
2017-08-17 20:22:14
阅读次数:
129
由于hive由java编写,所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符,比如用java的转义字符——反斜杠(\)+0+八进制数字可以代表任意ASCII码,或者用\u + 四位数字可以代表任意Unicode字符。 比如 ...
分类:
其他好文 时间:
2017-08-17 17:22:20
阅读次数:
878
一 字符串格式化 占位符 %s和%d %s是属于字符串的占位符,而%d是属于数字类型的占位符 二 编码和二进制 编码的意思就是计算机的语言,相当于是密码。而编码就是有一堆0和1的二进制数字组成的。 最开始发明计算机的是美国,于是第一种编码就由美国而产生的,叫做ascii码。 ascii码是8个bit ...
分类:
编程语言 时间:
2017-08-17 17:21:24
阅读次数:
148
编码,二进制(基础知识) 0,1信号的 解释规则不一样 得到的信息不一样 7位--0101000-->> 有 2^7 128 可能 + 一位扩展位 美国 ASCII码 二进制-->>> 最高位为0 1byte 字节 = 8bit 位1KB=1024byte1MB=1024KB1GB=1024MB1T ...
分类:
其他好文 时间:
2017-08-17 14:45:02
阅读次数:
118
判断一个字符是不是汉字通常有三种方法: [1] 用 ASCII 码判断;[2] 用汉字的 UNICODE 编码范围判断;[3] 用正则表达式判断。 1、用ASCII码判断 在 ASCII码表中,英文的范围是0-127,而汉字则是大于127,具体代码如下: 2、用汉字的 UNICODE 编码范围判断 ...
在网络编程中,需要将URL参数中含有的特殊字符通过在'%'后加上ASCII码的两位十六进制的方法,转换成服务器端能够识别的字符,如空格的ASCII码为32即16进制的0x20,则需要替换为"%20"。 题目:请实现一个函数,把传入char*字符串中的每个空格替换成"%20",例如输入"We are ...
分类:
编程语言 时间:
2017-08-17 14:34:16
阅读次数:
250
2017-08-16 21:29:30 基本的 ASCII 字符集共有 128 个字符,其中有 95 个可打印字符,包括常用的字母、数字、标点符号等,另外还有 33 个控制字符。标准 ASCII 码使用 7 个二进位对字符进行编码,对应的 ISO 标准为 ISO646 标准。 控制字符 在ASCII ...
分类:
其他好文 时间:
2017-08-16 23:01:54
阅读次数:
252
第四 print函数 print 编码 代码编码与文件编码要一致 py2:中文会报错 默认ASCIIpy3:不报错 默认UTF-8 ASCII码(255个)不包括中文 UTF-8(所有字符) gbk--(中文) py2 >>>转换 #-*- encoding:utf-8 -*- py2 >>>转换 ...
分类:
编程语言 时间:
2017-08-16 20:23:10
阅读次数:
137