Data Types1,list 2,tuple 3,sets 4,dictionary,
分类:
编程语言 时间:
2014-05-09 03:21:50
阅读次数:
244
http://wiki.apache.org/hadoop/Hbase/ThriftApi首先根据Hbase.thrift文件生成Python接口代码,Hbase.thrift在Hbase的源码中有,路径src/main/resources/org/apache/hadoop/hbase/thrif...
分类:
编程语言 时间:
2014-05-09 02:51:31
阅读次数:
344
集合的Jaccard相似度定义:对于两个集合A和B,A和B的Jaccard相似度记为SIM(A,B)=|A∩B|/|A∪B|。
计算文档内容的相似度可以用来检测文档抄袭作弊或者镜像页面等。
为了计算文档内容之间的相似度,首先也将文档进行分词处理,然后计算Jaccard相似度。
shingling用来处理文档内容的分词,需要考虑shingle的大小。
例如,字符串“abcd" , 2个shi...
分类:
其他好文 时间:
2014-05-09 00:41:45
阅读次数:
290
package FormatData;import
java.text.DateFormat;import java.util.regex.Matcher;import
java.util.regex.Pattern;import com.sun.org.apache.xerces.internal...
分类:
其他好文 时间:
2014-05-09 00:05:49
阅读次数:
532
分享一个php rc4加密算法实例代码,此php加密算法的解密方法是重新加密一次,便可还。/*
* rc4加密算法 * $pwd 密钥 * $data 要加密的数据 */ function rc4 ($pwd,
$data)//$pwd密钥 $data需加密字符串 { $key[] =""; $bo...
分类:
Web程序 时间:
2014-05-08 23:54:57
阅读次数:
678
----------------------
ASP.Net+Android+IOS开发、.Net培训、期待与您交流!
----------------------正则表达式是一种描述字符串集的方法,它是以字符串集中各字符串的共有特征为依据的。正则表达式可以用于搜索、编辑或者是操作文本和数据。它超出...
分类:
其他好文 时间:
2014-05-08 23:52:58
阅读次数:
558
c:\python33\python.exe c:\python33\trycoding.py
分类:
编程语言 时间:
2014-05-08 23:34:49
阅读次数:
399
StringUtils工具类具有对String具有简单而强大的处理能力,从检查空串到分割字符串,到生成格式化的字符串,使用都很方便简洁,能减少很多代码量;
详细的使用方法可以参考下面的例子或者官方的API(http://commons.apache.org/proper/commons-lang/j...
分类:
其他好文 时间:
2014-05-08 23:33:55
阅读次数:
583
格式化源码是很常见的需求,emacs有个indent-region函数用于格式化选定的代码,前提是你处在某个非text
mode下,如c-mode或者java-mode之类。如果要格式化整个文件,你需要先选定整个文件(C-x-h),然后调用indent- region(或者
C-M-\ )。两个命....
分类:
其他好文 时间:
2014-05-08 23:11:40
阅读次数:
395
FileUtils//文件管理工具FileUtils::getInstance()std::string getStringFromFile(const
std::string& filename);//读取文件中的字符串Data getDataFromFile(const
std::string&...
分类:
移动开发 时间:
2014-05-08 23:00:07
阅读次数:
419