目前我常常使用的分词有结巴分词、NLPIR分词等等最近是在使用结巴分词,稍微做一下推荐,还是蛮好用的。一、结巴分词简介利用结巴分词进行中文分词,基本实现原理有三:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)采用了动态规划查找最大概率路径, 找出基于...
分类:
编程语言 时间:
2014-10-17 23:14:23
阅读次数:
319
HDU 3016 Man Down
题目链接
题意:是男人就下100层的游戏的简单版,每次只能从两端下落,求落地最大血量
思路:利用线段树可以处理出每个线段能来自哪几个线段,然后就是dag最长路了
代码:
#include
#include
#include
#include
using namespace std;
const int N = 100005...
分类:
其他好文 时间:
2014-10-17 13:52:20
阅读次数:
187
DAGScheduler面向stage的调度层,为job生成以stage组成的DAG,提交TaskSet给TaskScheduler运行。每个Stage内,都是独立的tasks,他们共同运行同一个compute function,享有同样的shuffledependencies。DAG在切分stag...
分类:
其他好文 时间:
2014-10-14 23:37:19
阅读次数:
344
Air Raid
Time Limit: 1000MS
Memory Limit: 10000K
Total Submissions: 6763
Accepted: 4034
Description
Consider a town where all the streets are one-way and each stree...
分类:
其他好文 时间:
2014-10-12 02:05:37
阅读次数:
220
题意:给定一个有向图,寻找一个点数最大集合,使得这个集合中的任意两个点 u,v, 都有u->v 或者 v->u 或者uv 思路:首先将强连通分量通过tarjan算法求出来,然后进行缩点,也就是每一个缩点 所组成的图就是一个DAG图!令每一个点的权值就是这个缩点所包含节点(也就是对应的 强连通分量的....
分类:
其他好文 时间:
2014-10-11 23:18:06
阅读次数:
393
RDD是Spark最基本,也是最根本的数据抽象。http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf 是关于RDD的论文。如果觉得英文阅读太费时间,可以看这篇译文:http://shiyanjun.cn/archives/744.html
本文也是基于这篇论文和源码,分析RDD的实现。
第一个问题,RDD是什么?Resilient Distributed Datasets(RDD,) 弹性分布式数据集。RDD是只读的、分区记录的集合。RD...
分类:
其他好文 时间:
2014-10-07 18:59:34
阅读次数:
331
首先,我们要tarjan。。。 然后我们要缩点。。。注意,缩点的时候两个新建的点会有重边,需要判重正常的判重方法是bfs一边,但是我YY的比较奇葩,方法下面将。。。缩好点就变成了一个DAG,然后就类似树形DP的方法求最大权值链我是用记忆化搜索,当dfs某个点p时用数组vis记录一些东西:首先vis[...
分类:
其他好文 时间:
2014-10-06 23:54:12
阅读次数:
333
题目链接
题意:给定一张有向图,问最少选择几个点能遍历全图,以及最少添加几条边使得有向图成为一个强连通图。
思路:对于有向图而言,首先求出有几个强连通分量,之后将每个强连通分量缩点,形成DAG,本题开头第一句就说图是连通的了。之后想要遍历整张图的话,只要找出入度为0的点有几个,而添加边的数量就取决于所有点的出入度大小。
代码:
#include
#include ...
分类:
Web程序 时间:
2014-10-03 17:10:14
阅读次数:
225
最短路径问题包括:1、单源最短路。2、任意两点间的最短路。3、次短路和k短路。4、差分约束系统。5、DAG图上的单源最短路。6、最小环。一、单源最短路算法:Dijkstra、Bellman-Ford、SPFADijkstra:除了路径记录和更新距离数组的部分意外,和Prim算法的实现完全一样。使用邻...
分类:
其他好文 时间:
2014-09-29 00:04:35
阅读次数:
319
题目链接
题意:给出一张有向图,求一个结点数最大的结点集,使得该结点集中任意两个结点u和v满足:要么u可以到到v,要么v可以到达u(u和v可以互相到达)
思路:我们可以缩点,用Tarjan求出所有强连通分量,让每个SCC的权值等于它的结点个数。由于SCC图是有一个DAG,使用DP求解。
代码:
#include
#include
#include
#inclu...
分类:
其他好文 时间:
2014-09-28 13:47:32
阅读次数:
153