在NLP的相关任务中,应用python处理中文是很常见的。在这个过程中,由于编码方式的不一致,可能会出现以下两种错误: 1)SyntaxError: Non-ASCII character in file ‘文件名’ 2)UnicodeDecodeError: 'ascii' codec can't ...
分类:
编程语言 时间:
2018-12-23 19:28:55
阅读次数:
519
Nginx访问日志 这里补充下Nginx访问日志使用的说明。一般在nginx.conf主配置文件里需要定义一种格式: 上面的格式我是基于默认的加了一个 。 然后子配置使用: 即可。 Filebeat采集日志数据到ElasticSearch 配置: 配置详情: 配置说明: filebeat.prosp ...
分类:
其他好文 时间:
2018-12-22 14:55:21
阅读次数:
178
1、截取: ffmpeg -i 1.mp4 -ss 00:46:15 -c copy -t 02:00:00 out1.mp42、合并: ffmpeg -i out1.mp4 -vcodec copy -acodec copy -vbsf h264_mp4toannexb 1.ts ffmpeg - ...
分类:
其他好文 时间:
2018-12-19 15:43:29
阅读次数:
158
1、预分区设计 附:splits.txt 2、rowkey设计 3、HBase优化 ...
分类:
其他好文 时间:
2018-12-15 23:56:29
阅读次数:
263
起因:jieba.load_userdict('C:\\Users\\lim\\Desktop\\dict.txt') 异常描述: 由异常描述可知,结巴默认的是使用“utf-8”来打开文件,因此我们需要修改文件的编码 属于编码解码的问题,默认的会跟随系统使用GBK,需要修改成UTF-8 首先在文件的 ...
分类:
其他好文 时间:
2018-12-14 13:04:51
阅读次数:
156
window 读取文件可以用\,但是在字符串中\是被当作转义字符来使用,所以’d:\a.txt’会被转义成’d:\a.txt’这是正确路径,所以不会报错。而‘C:\Users\FrankYuan\Pictures\Camera Roll\WIN_20161010_08_51_57_Pro.jpg ’ ...
分类:
其他好文 时间:
2018-12-14 10:54:44
阅读次数:
141
代码: 结果: max_iter=10 max_iter=20 注意: 1. 当使用pickle加载mnist数据时,python3.x与python2.x差距较大,python3.x会抛出异常,异常信息为:UnicodeDecodeError: 'ascii' codec can't decode ...
分类:
其他好文 时间:
2018-12-13 14:56:22
阅读次数:
431
[root@server5elk]#rpm-ivhlogstash-2.3.3-1.noarch.rpm[root@server5logstash]#/opt/logstash/bin/logstash-e‘input{stdin{}}output{stdout{codec=>rubydebug}}‘Settings:Defaultpipelineworkers:1Pipel
分类:
其他好文 时间:
2018-12-11 17:31:04
阅读次数:
197
文件操作 文件路径:d:\a.txt 编码方式:utf-8,gbk,GB2312.... 操作方式:只读,只写,写读,读写,追加 等。 报错原因: UnicodeDecodeError: 'gb2312' codec can't decode byte 0xa6 in position 2: ill ...
分类:
编程语言 时间:
2018-12-09 18:55:04
阅读次数:
210