目录 1.中文语料常常遇到编码问题,将任意字符集文件转为utf-8编码 2.将unlabel文件夹中的所有.txt文件合并,每个文件之间空一行 3.随机抽取.txt文件中的60%,20%,5% 4.将已经分好词的文件去掉空格(正则),恢复成文件原来的样子 5.读取excel文件转换成.json文件 ...
分类:
其他好文 时间:
2021-06-04 18:46:36
阅读次数:
0
前端框架vue-element-admin,后端abpvnext提供webapi。 在实现文件上传下载功能中,文件可通过abpvnext中BLOB对象的FileSystem进行存储,即将BLOB作为标准文件存储在本地文件系统的文件夹中. 一,引入blob的nuget包 Volo.Abp.BlobSt ...
分类:
其他好文 时间:
2021-06-03 18:14:04
阅读次数:
0
ascii(只有英文) A : 00000010 8位 一个字节 unicode A : 00000000 00000001 00000010 00000100 32位 四个字节 中:00000000 00000001 00000010 00000110 32位 四个字节 utf-8 A : 001 ...
分类:
其他好文 时间:
2021-06-03 17:37:11
阅读次数:
0
python读取图片里面的文字 需要安装的依赖包:PIL Pytesseract 1、安装包 PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/) 注意:pillow是用于替代PIL的,所以在实际使用中需要i ...
分类:
其他好文 时间:
2021-06-02 20:08:18
阅读次数:
0
1.所需资料: 再生龙:clonezilla-live-2.7.1-22-amd64.iso,UltraISO 2.操作步骤: 首先使用UltraISO将再生龙写入U盘,注意写入的时候,要使用RAW模式。 其次,按照步骤: 选择第一项,然后语言选择简体中文,键盘选择美式键盘,然后选择Start_Cl ...
分类:
其他好文 时间:
2021-06-02 20:07:57
阅读次数:
0
国际化 internationalization i18n 支持不同的语言环境 如果支持中文环境 需要在res目录下创建一个values-zh目录 在这个目录中放一个string.xml 这个xml文件中所有的内容都是用中文写的 写代码的时候 涉及到字符串的内容 能使用R.string 或者布局文件 ...
分类:
其他好文 时间:
2021-06-02 20:02:07
阅读次数:
0
问题:TP从服务器数据中取出的collection数据,当进一步在网页中进行分页显示时,需要调用order函数,实现类似如下图的排序。 当点击页面中的相关内容时,实现对服务器数据进行重排,就要调用TP编写的order函数。 但是,上述属性中包括int属性,包括中文字符串属性,我们希望按单位名称和单位 ...
分类:
编程语言 时间:
2021-06-02 19:07:51
阅读次数:
0
正则匹配全部汇总:1、匹配中文:[\u4e00-\u9fa5]2、英文字母:[a-zA-Z]3、数字:[0-9]4、匹配中文,英文字母和数字及下划线: ^[\u4e00-\u9fa5_ a-zA-Z0-9]+$同时判断输入长度:[u4e00-\u9fa5_ a-zA-Z0-9 l]{4,10}<5、 ...
分类:
其他好文 时间:
2021-06-02 18:56:00
阅读次数:
0
我们在使用JMeter的过程中,有时候会要到乱码的问题。一是新增的时候出现乱码,还有就是接口的响应出现乱码。 一、新增的时候出现乱码 方法一:添加HTTP请求时在Content encoding后填入编码:utf-8 看一下结果:没有乱码了 方法二:在请求中加一个BeanShell前置处理器,在sc ...
分类:
其他好文 时间:
2021-06-02 17:39:51
阅读次数:
0
1.选中要生成的文件。 2.点击菜单栏 Tools->Generate JavaDoc,进入以下界面 3.将Other command line arguments:设置为-encoding utf-8 -charset utf-8 ,这是确认编码方式,防止有中文乱码,后面的windowtitle是 ...
分类:
编程语言 时间:
2021-06-02 17:10:43
阅读次数:
0