集合的Jaccard相似度定义:对于两个集合A和B,A和B的Jaccard相似度记为SIM(A,B)=|A∩B|/|A∪B|。
计算文档内容的相似度可以用来检测文档抄袭作弊或者镜像页面等。
为了计算文档内容之间的相似度,首先也将文档进行分词处理,然后计算Jaccard相似度。
shingling用来处理文档内容的分词,需要考虑shingle的大小。
例如,字符串“abcd" , 2个shi...
分类:
其他好文 时间:
2014-05-09 00:41:45
阅读次数:
290
今天写了安卓程序与服务器通信,其中需要从服务器获取图片。本来以为下载流、处理文件流很复杂,结果几句话就轻松搞定了。现在记在这里。 // (2014.5.1第一种方法)通过服务器返回的图片url,再次向服务器请求,添加动态新闻图片
// 读取Bitmap图片
try {
Bitmap bm;
URL url;
url = new URL(map.get("activity...
分类:
其他好文 时间:
2014-05-09 01:18:18
阅读次数:
365
题目详情
给你一个数组A[n],请你计算出ans=min(|A[i]+A[j]|)(0
例如:A={1, 4, -3},
则:
|A[0] + A[0]| = |1 + 1| = 2.
|A[0] + A[1]| = |1 + 4| = 5.
|A[0] + A[2]| = |1 + (-3)| = 2.
|A[1] + A[1]| = |4 + 4| = 8.
|A[1] +...
分类:
其他好文 时间:
2014-05-09 01:17:47
阅读次数:
331
1、Clone Graph
Clone an undirected graph. Each node in the graph contains a label and
a list of its neighbors.
OJ's undirected graph serialization:
Nodes are labeled uniquely.
We use # as...
分类:
其他好文 时间:
2014-05-09 02:17:58
阅读次数:
336
这是一道好题,思路虽然有,但是提交之后总是有数据过不了,又按照数据改改改,最后代码都没法看了。收到的教训是如果必须为自己的代码加上很多很多特殊的限定,来过一些特殊的数据的话,说明代码本身有很大的漏洞。
这道题,我想到了要用两个指针保存乱序的节点,甚至想到了用一个pre指针来保存前面一个节点,但是问题出在哪里呢?我觉得应该是自己对树的遍历理解的不够深刻。既然知道了二叉搜索树一定是用中序遍历的,那么...
分类:
其他好文 时间:
2014-05-09 01:54:42
阅读次数:
250
有了上面的教训,这道题就简单多了,什么时候该更新pre是明确的了,倒是有个细节,二叉搜索树中是不允许有相等节点的,所以题目的要求用黑体字标明了。写的时候注意就可以了。
class Solution {
public:
TreeNode *pre = NULL;
bool isValidBST(TreeNode *root) {
if(root == NULL) ...
分类:
其他好文 时间:
2014-05-09 01:33:43
阅读次数:
269
历届试题 带分数
时间限制:1.0s 内存限制:256.0MB
问题描述
100 可以表示为带分数的形式:100 = 3 + 69258 / 714。
还可以表示为:100 = 82 + 3546 / 197。
注意特征:带分数中,数字1~9分别出现且只出现一次(不包含0)。
类似这样的带分数,100 有 11 种表示法。
输入格式
从标准输入读入一个正整数...
分类:
其他好文 时间:
2014-05-09 02:13:37
阅读次数:
301
问题:
一副扑克牌,除去大小王后共52张牌,随机从中抽八张牌,问八张牌的和最有可能是多少?
分析:
这52张牌,其实就是数字 1 2 3 。。。13, 每个数字出现4次。随机抽出8个数,问组成的和最有可能是多少?
聪明的你可能想到了另一个很类似的问题,2 sum: 问一个数组中是否存在两个数的和等于某个给定的值。
当然,这里就类似于 8 sum。 但是,题目却问的是,最有...
分类:
其他好文 时间:
2014-05-09 02:17:32
阅读次数:
197
圆与扇形的碰撞检测,以前用过一种算法是这样的:
首先把扇形视作一个圆,排除圆与扇形圆不相交的情况,
然后如果圆心在扇形两条边中间,则必然相交,
剩下的就判断圆是否与两条边相交。
这种算法用到了点与直线的关系,圆与线段的碰撞检测,圆与圆的碰撞检测等,算法清晰,实现起来比较简单,但只能适用于扇形夹角小于180度的情况。
今天偶尔想到了一种新的算法:
首先把扇形视作一个圆,排除圆与扇...
分类:
其他好文 时间:
2014-05-09 01:33:18
阅读次数:
618
Document 不需要打印的地方
要打印的内容要打印的内容要打印的内容要打印的内容要打印的内容要打印的内容要打印的内容要打印的内容要打印的内容
分类:
Web程序 时间:
2014-05-09 00:01:06
阅读次数:
403
最近一段时间,都在使用Jquery-Mobile +
MVC做手机Web,有一些心得、体会下面介绍如何拒绝电脑访问手机网站电脑的浏览器,跟手机的浏览器内核不一样,这是我设置拒绝访问的思路。下面是我已经封装好了的一个拒绝访问的一个方法
1 public static class IsMobileDe....
分类:
移动开发 时间:
2014-05-09 00:00:33
阅读次数:
404
CSS 要求:看懂 CSS是层叠样式表(Cascading Style
Sheets):用来定义网页的显示效果。 html代码展示数据,css如何展示,以什么形式展示。 HTML与CSS结合 1
内联:每一个标签提供style属性,进行样式的设置...
分类:
Web程序 时间:
2014-05-09 00:00:04
阅读次数:
441