首先,SimHash算法主要是用于文本去重的。文本去重的第一步就是判断文本的相似度,如果两个文本的相似度很
高,那么我们可以认为它们是相同的文本。
对于文本相似度的计算,传统的方法是使用向量空间模型,即Vector Space Model,即VSM,VSM计算文本相似度
的方法是这样的:先对文本进行分词,提取出特征词,然后建立文本向量,把相似度的计算转化成某种特征向量距离
的计算,比...
分类:
其他好文 时间:
2014-06-02 05:02:30
阅读次数:
500
设计模式
单件模式:确保一个类只有一个实例,并提供一个全局访问点。
要点
单件模式确保程序中一个类最多只有一个实例。
在Java中实现单件模式需要私有的构造器、一个静态方法、一个静态变量。
确定在性能和资源上的限制,然后小心翼翼的选择适当的方案来实现单件,以解决多线程问题。
全局变量缺点
如果将对象赋值给一个全局变量,那么必须在程序一开始就创建好对象。万一对象非常耗费...
分类:
其他好文 时间:
2014-06-02 05:00:32
阅读次数:
215
【前言】
本文简单的介绍了加密技术相关概念,最后总结了java中现有的加密技术以及使用方法和例子
【最简单的加密】
1.简单的概念
明文:加密前的信息
密文:机密后的信息
算法:加密或解密的算法
密钥:算法使用的钥匙(读作miyao,正确应该是miyue,但是大家都读miyao)
2.简单的例子
将123456每位数字都加1后得到234567,
其中123456...
分类:
编程语言 时间:
2014-06-02 04:41:25
阅读次数:
319
学习Android开发入门第四章:类与对象(上)-掌握成员变量和局部变量的使用-掌握方法重载和重写-掌握构造方法的执行过程-掌握static关键字的使用-掌握多态本章链接:1)http://pan.baidu.com/s/1gdmm3Nt2)http://pan.baidu.com/s/1kTn0sCZ<5>第五章:类与对象(下)-掌..
分类:
移动开发 时间:
2014-06-02 04:09:43
阅读次数:
331
<!DOCTYPEhtml>
<html>
<headlang="en">
<metacharset="UTF-8">
<title>数组</title>
<scripttype="text/javascript">
vara1=[1,4,5,7,8];
vara2=newArray(‘b‘,‘a‘,‘d‘);
a1.sort(function(i,j){
returni-j;
});
a2.sort();
consol..
分类:
编程语言 时间:
2014-06-02 04:05:42
阅读次数:
354
连接Oracle11GR2ASM实例
开始连接ASM时候,效仿10G的方法却怎么都连接不到ASM
连接的都是idle实例
[root@tip02~]#su-oracle
[oracle@tip02~]$exportORACLE_SID=+ASM2
[oracle@tip02~]$sqlplus/assysdba
SQL*Plus:Release11.2.0.3.0ProductiononWedMay1618:23:392012
Copyri..
分类:
数据库 时间:
2014-06-02 04:02:29
阅读次数:
314
求和print(Array(1,7,2,9).sum)结果19要使用sum方法,元素类型必须是数值类型:要么是整形,要么是浮点数或者BigInteger/BigDecimal。print(ArrayBuffer("Mary","had","a","little","lamb").max)结果little排序valb=ArrayBuffer(1,7,2,9)
valbSorted=b.sorted
print(bSorted)..
分类:
其他好文 时间:
2014-06-02 03:23:26
阅读次数:
354
多谢董老师,董老师是个好老师!
心情久久不能平静,主要是高频这门课的分析方法实在是让我难以理解,公式也背不过,还是放放吧。
最近厌恶了Matlab臃肿的体积和频繁的读写对我的Mac的损害,所以学习了一下Python这一轻量级的脚本,发现“Python自诞生那天就跟科学计算分不开”这个事实。无聊,写写心得。
配置环境什么的还是弄了几个晚上的。在Mac下用PyCharm还是很好滴,装上NumPy...
分类:
编程语言 时间:
2014-06-02 02:17:28
阅读次数:
623
设计模式
工厂模式:定义一个创建对象的接口,但由子类决定要实例化的是哪一个。工厂方法让类把实例化推迟到子类。
所谓的“决定”,并不是指模式允许子类本身在运行时做决定,而是指在编写创建者类时,不需要知道实际创建的产品是哪一个。选择了使用这个子类,就自然的决定了实际创建的产品是什么。
抽象工厂模式:提供一个接口,用于创建相关或依赖对象的家族,而不需要指定具体类。
抽象工厂的任务时定义一...
分类:
其他好文 时间:
2014-06-02 02:15:39
阅读次数:
255