1. 取出两个文件的并集(重复的行只保留一份)2. 取出两个文件的交集(只留下同时存在于两个文件中的文件)3. 删除交集,留下其他的行1. cat file1 file2 | sort | uniq2. cat file1 file2 | sort | uniq -d3. cat file1 fil...
分类:
系统相关 时间:
2014-07-30 23:24:25
阅读次数:
376
Python 获取Twitter用户与Friends和Followers的关系(eg, 交集,差集)...
分类:
编程语言 时间:
2014-07-30 07:41:03
阅读次数:
272
使用comm命令假设两个文件FILE1和FILE2用集合A和B表示,FILE1内容如下:abceda FILE2内容如下:cdac基本上有两个方法,一个是comm命令,一个是grep命令。分别介绍如下:comm命令, Compare sorted files FILE1 and FILE2 lin....
分类:
系统相关 时间:
2014-07-29 21:40:32
阅读次数:
511
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。集就是让每个元素构成一个单元素的集合,也就是按一定顺序将属于同一组的元素所在的集合合并。Find:确定元素属于哪一个子集。它可以被用来确定两个元素是否属于同一子集合。Union...
分类:
其他好文 时间:
2014-07-29 10:41:06
阅读次数:
270
问题:例如下面两站表A,B.A表和B表分别有5-10w数据。A表结构如下:id bid name title publisher extraB表结构如下id bid name title publisher A出版社也为很多人出版了书籍,B出版社也为很多人出版了书籍,有sql语句找出这两个出版社为那...
分类:
数据库 时间:
2014-07-28 23:47:14
阅读次数:
363
一 基础知识梳理:并查集(Union-find Sets)是一种非常精巧而实用的数据结构,它主要用于处理一些不相交集合的合并问题。一些常见的用途有求连通子图、求最小生成树的 Kruskal 算法和求最近公共祖先(Least Common Ancestors, LCA)等。使用并查集时,首先会存在一组...
分类:
其他好文 时间:
2014-07-27 22:19:59
阅读次数:
323
越来越多的人开始意识到,网站即软件,而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点。网站开发,完全可以采用软件开发的模式。但是传统上,软件和网络是两个不同的领域,很少有交集;软件开发主要针对单机...
分类:
其他好文 时间:
2014-07-25 02:33:04
阅读次数:
216
1.不相交集是解决等价关系的一种数据结构,执行合并和查找的速度都非常快,M次运行合并和查找的运行时间为(M*logN)。
在一个集合中,对于每一对元素(a,b),a,b∈S,对于关系R如果满足下面三个条件,则成关系R为等价关系:
(1)自反性 对于所有a∈S,aRa
(2)对称性 aRb当且仅当bRa
(3)传递性 若aRb且bRc,则aRc
有关不相交集的介绍...
分类:
编程语言 时间:
2014-07-20 10:14:09
阅读次数:
321
并查集(Union-find Sets)是一种非常精巧而实用的数据结构,它主要用于处理一些不相交集合的合并问题。一些常见的用途有求连通子图、求最小生成树的 Kruskal 算法和求最近公共祖先(Least Common Ancestors, LCA)等。
使用并查集时,首先会存在一组不相交的动态集合 S={S1,S2,?,Sk},一般都会使用一个整数表示集合中的一个元素。
每个集合可能包含一个...
分类:
其他好文 时间:
2014-07-19 23:23:29
阅读次数:
378
【转载】原帖:http://blog.sciencenet.cn/blog-485553-753738.html在企业从事技术工作的我本该与“生物力学之父”冯元桢先生没什么交集,但因本人从事机械行业的流体传动与控制技术领域,幻想能否用流体力学与机械结构作类比,解析高血压现象,于是找来一本《人体解剖学...
分类:
其他好文 时间:
2014-07-16 18:39:56
阅读次数:
194