文本特征向量 经典的向量空间模型(VSM: Vector Space
Model)由Salton等人于60年代提出,并成功地应用于著名的SMART文本检索系统。VSM概念简单,把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂。当文档被表示为文档空间的向量...
分类:
其他好文 时间:
2014-06-07 06:02:47
阅读次数:
248
1.基本概念:
NLP:自然语言处理是研究如何利用计算机技术对语言文本(句子、篇章或话语等)进行处理和加工的一门学科,研究内容包括对词法、句法、语义和语用等信息的识别、分类、提取、转换和生成等各种处理方法和实现技术。
语言的基本属性:语音和文字 2.研究内容: 3.基本问题: a)形态学(morph...
分类:
其他好文 时间:
2014-06-03 13:45:29
阅读次数:
428
1、script文件放在body标签最后,script默认是
type="text/javascript",所以可以省略 2、css文件也要提取出来单独放在一个.css文件中用引入文件中
3、建立scripts文件夹,用于放置脚本文件 4、建立css文件夹用于放置c...
分类:
Web程序 时间:
2014-06-03 11:09:34
阅读次数:
304
声明:该笔记引自W3School! 元素用于提取某个选定节点的值,并把值添加到转换的输出流中:
My CD Collection Title Artist 注意:select属性的值是一个 ...
分类:
其他好文 时间:
2014-06-03 08:19:37
阅读次数:
241
在对eml文件进行索引的时候需要先对其进行解析,提取出其中的收件人、发件人、文件内容和附件等信息下边是解析eml文件的一个demo(在运行之前需要先导入mail.jar
和commons-email.jar) 1 package com.jiaoyiping.windowsfilesearch.te...
分类:
其他好文 时间:
2014-05-31 06:11:38
阅读次数:
478
说明 本文参考MDU系列某产品OMCI模块现有代码,提取若干实例以说明目前的代码质量。
本文旨在就事论事,而非否定前人(没有前人的努力也难有后人的进步)。希望以史为鉴,不破不立,最终产出高质量的代码。一 质量现状
不考虑业务实现,现有的OMCI模块代码质量不甚理想。无论是理解上手、修改扩展和测...
分类:
其他好文 时间:
2014-05-30 09:23:31
阅读次数:
320
驱动增压免费最有效和最容易使用的驱动程序更新免费下载安装版V 1.4.0.61 | 15.7
MB支持Windows
XP/Vista/7/8提取密码:1ai4立即下载绿色版什么驱动增压器免费呢?过时的驱动程序可能会严重影响电脑的性能,并导致系统崩溃。驱动增压免费,设计的IObit最先进的驱动程序更...
分类:
其他好文 时间:
2014-05-30 07:03:29
阅读次数:
381
MYSQL通常单机单实例,每个实例下面有很多不同的库,备份时带上--all-databases,有时候会需要从备份文件里面抽取单个库,或者某个库下的某个表。如果还原全部数据库,肯定是可以做到的,但是时间代价非常大。下面这个脚本就是实现快速提取单个库,单个表#/bin/bash#author
:zuo...
分类:
其他好文 时间:
2014-05-30 04:02:31
阅读次数:
310
这个能取大部分汉字的首字母, 但还不全, 有些UNICODE的汉字是取不到的,
要想取到所有汉字的首字母,最好是能做一个UNICODE汉字和拼音的对照表,通过对照表查.GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日...
分类:
其他好文 时间:
2014-05-28 13:43:27
阅读次数:
420
1、客户端(主要处理连接,授权认证,安全等)。2、MYSQL服务器层(核心服务功能都在这层,包括,查询解析,分析,优化,缓存以及所有的内置函数,所有跨存储引擎的功能都在这层实现:存储过程,触发器,视图等)。3、存储引擎层(负责MYSQL中数据的存储和提取,服务器通过API与存储引擎进行通信。这些接口...
分类:
数据库 时间:
2014-05-27 16:57:11
阅读次数:
370