前言 关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来。这个可以追溯到文献检索初期,关键词是为了文献标引工作,从报告、论文中选取出来用以表示全文主题内容信息的单词或术语,在现在的报告和论文中,我们依然可以看到关键词这一项。因此,关键词在文献检索、自动文摘、文本聚类/分类等方面有着重要 ...
分类:
其他好文 时间:
2019-12-02 17:25:30
阅读次数:
103
Python基础之--from __future__ import unicode_literals作用 转 ① Python的每个新版本都会增加一些新的功能,或者对原来的功能作一些改动。有些改动是不兼容旧版本的,也就是在当前版本运行正常的代码,到下一个版本运行就可能不正常了 ② 从python 2 ...
分类:
编程语言 时间:
2019-12-02 13:46:56
阅读次数:
71
python字符串格式化 Python的字符串格式化有两种方式:%格式符方式,format方式 %格式符 %[(name)][flags][width].[precision]typecode (name) 可选,用于选择指定的key flags 可选,可供选择的值有: + 右对齐;正数前加正好,负 ...
分类:
编程语言 时间:
2019-12-01 11:37:11
阅读次数:
65
数据结构式通过某种方式(例如对元素进行编号)组织在一起的数据元素的集合,这些数据元素可以是数字或者字符,甚至可以是其他数据结构。在Python中,最基本的数据结构是序列(sequence)。序列中的每个元素被分配一个序号--即元素的位置,也称为索引。第一个元素索引是0,第二个则是1,一次类推。Python包含6中内建的序列,即列表、元组、字符串、Unicode字符串、buffer对象和xrange
分类:
编程语言 时间:
2019-11-30 22:42:05
阅读次数:
153
方法1: ①的Unicode编码为2460(十六进制) P.S.十六进制数中0-15用0123456789abcdef表示 在word中打"2460",紧接着按“Alt+x”组合健,“2460”立即转换成了"①"。 同理,打"246c"得到的就是"?",打"41"得到的是"A"。 方法2: 复制本文 ...
分类:
其他好文 时间:
2019-11-30 21:12:56
阅读次数:
170
下面是在Java中标识符的定义 1.标识符由字母、数字、货币符号(¥、$等)、连接符号(_等)组成。(这里的字母为Unicode字符集, 而不再局限于传统的26个英文字母。)2.标识符的首字符可以是字母、货币符号与连接符号,但不能是数字。3.标识符不能与Java中的关键字相同。4.标识符不能和Jav ...
分类:
编程语言 时间:
2019-11-29 22:14:33
阅读次数:
92
about chardet提供自动检测字符编码的功能。 当我们在处理一些不规范的网页的时候。虽然Python提供了Unicode表示的str和bytes两种数据类型,并且可以通过encode()和decode()方法转换,但是在不知道编码的情况下,对bytes做decode()容易失败。 对于未知编 ...
分类:
其他好文 时间:
2019-11-28 22:54:55
阅读次数:
152
jupyter安装出现问题:安装后无法打开 traitlets.traitlets.TraitError: Could not decode 'C:\Users\\xce\xa2\xcc\xf0\xd0\xc4\xd3\xef\.jupyter' for unicode trait 'config_ ...
分类:
其他好文 时间:
2019-11-27 16:13:25
阅读次数:
58
<script>function HashMap(){this.map = {};}HashMap.prototype = { put : function(key, value){ this.map[key] = value;}, get : function(key){ if(this.map. ...
分类:
Web程序 时间:
2019-11-27 12:40:24
阅读次数:
100
基础类型补充 str 字符串 list 列表 tuple 元组 dict 字典 循环删除的坑 编码进阶 ...
分类:
编程语言 时间:
2019-11-26 13:30:43
阅读次数:
69