mysql配置问题,导致上传azkaban上传包时出现 已经设置过max_allowed_packet了 innodb 引擎还需设置innodb_log_file_size,这个值默认50m 最终的my.cnf配置如下 参考资料 https://github.com/azkaban/azkaban/ ...
分类:
数据库 时间:
2020-04-15 17:51:51
阅读次数:
122
一、信息提取 信息提取结构 二、分块 名词短语分块(NP chunking NP 分块) 寻找单独名词短语对应的块 缝隙 为不包括在大块中的标识符序列定义一个缝隙 加缝隙是从大块中去除标识符序列的过程 分为三种:标识符贯穿整块、标识符出现在块中间、标识符出现在块的周边 分块的表示:标记与树状图 I( ...
分类:
其他好文 时间:
2018-08-31 13:16:23
阅读次数:
313
If you have a multi-page application (as opposed to a single page app), you’re likely sharing modules between these pages. By chunking these common mo ...
分类:
移动开发 时间:
2016-06-23 06:25:40
阅读次数:
475
源码来源:TI DM8168EZSDK OMX examples decode_display
基本执行流程如下:
ilclient.c //主体程序文件
↓
void IL_ClientInputBitStreamReadTask (void*threadsArg);...
分类:
其他好文 时间:
2015-01-27 21:54:49
阅读次数:
392
最近调研了一下simhash算法,它主要用在谷歌网页去重中,网上有很多原理性的介绍。既然可以用来判断文件的相似性,就想知道效果怎么样,simhash的精确度是否依赖于分词算法?是否和simhash的长度有关?
在数据去重过程中,都是先对文件进行分块,而后得到关于这个文件的所有指纹(SHA-1 digest),那么如果把这些fingerprints视为这个文件的单词,作为simhash的输入,效果...
分类:
其他好文 时间:
2014-07-11 08:33:56
阅读次数:
217
首先对文件按内容分块(有块大小的约束),然后对于每个chunk构造单独的一个UDP 数据报进行传输,在应用层的开始是自定义的包头,有块号,块长度,块指纹等元数据信息,这些信息便于接收端能够按序正确接收。
/*--vonzhou
---this project is to upload file after chunking using
rabin fingerprint, h...
分类:
其他好文 时间:
2014-06-18 12:27:16
阅读次数:
171