基于Web 开发模式的信息抽取
信息抽取是一个互联网自然语言处理的一个首要环节,信息抽取的准确度会直接影响到后续的处理。信息抽取的目标是去除噪音,获取网页有价值的信息如网页的标题、时间、正文、链接等信息。
主流算法介绍
网页信息抽取的方法有很多,比如从算法上分:基于模板的,基于信息量、基于视觉的、基于语义挖掘的、基于统计的。从HTML 处理上分为:基于行块、基于DOM 树。下面...
分类:
Web程序 时间:
2016-06-21 07:33:50
阅读次数:
311
一、LVS概念LVS(LinuxVirtualServer):Linux虚拟服务器LVS是个负载均衡设备,它不提供任何服务,用户请求到这里的时候,它是将客户需求转发至后端真正提供服务的服务,所以说后端的服务称作realserver。LVS分为两段,前一段称为ipvsadm(管理集群服务的命令行工具),后面一..
分类:
编程语言 时间:
2016-06-17 17:32:09
阅读次数:
170
KNN算法介绍 (2012-11-14 12:32:29) 转载▼ KNN算法介绍 转载▼ 标签: 杂谈 杂谈 KNN算法是机器学习里面比较简单的一个分类算法了,整体思想比较简单:计算一个点A与其他所有点之间的距离,取出与该点最近的k个点,然后统计这k个点里面所属分类比例最大的,则点A属于该分类。这 ...
分类:
编程语言 时间:
2016-06-17 17:12:22
阅读次数:
187
一,分割(partition)算法介绍 所谓分割算法,先选定一个枢轴元素,然后 将数组中的元素分成两部分:比枢轴元素小的部分都位于枢轴元素左边;比枢轴元素大的部分都位于枢轴元素右边 此时,枢轴元素在数组中的位置就被“永久地确定”下来了 将整个数组排序,该枢轴元素的位置不会变化。 另外,枢轴元素的选取 ...
分类:
编程语言 时间:
2016-06-15 14:25:56
阅读次数:
230
插入排序算法介绍
排序算法是最简单的算法,也是最基本的算法。顾名思义,插入排序就是把当前待排序的元素插入到一个已经排好序的列表里面。 一个非常形象的例子就是右手抓取一张扑克牌,并把它插入左手拿着的排好序的扑克里面。插入排序的最坏运行时间是O(n2),
所以并不是最优的排序算法。特点是简单,不需要额外的存储空间,在元素少的时候工作得好。
插入排序算法Java实现
Java里面有很多数据类型...
分类:
编程语言 时间:
2016-06-06 01:16:03
阅读次数:
189
前面我们介绍了MapReduce中的Join算法,我们提到了可以通过map端连接或reduce端连接实现join算法,在文章中,我们只给出了reduce端连接的例子,下面我们说说使用map端连接结合分布式缓存机制实现Join算法 1、介绍 我们使用频道类型数据集和机顶盒用户数据集,进行连接,统计出每 ...
分类:
编程语言 时间:
2016-06-02 21:54:58
阅读次数:
337
加密算法介绍: 对称加密: DES:date encrption standard,56bit 3DES: AES: Advanced AES192,AES256,AES512 Blowfish 单向加密 MD4,MD5 SHA1, SHA192,SHA256,SHA384 CR3-32 公钥加密: ...
分类:
其他好文 时间:
2016-06-01 06:44:50
阅读次数:
191
一,希尔排序算法介绍 ①希尔排序又称缩小增量排序 ,它本质上是一个插入排序算法。为什么呢? 因为,对于插入排序而言,插入排序是将当前待排序的元素与前面所有的元素比较,而希尔排序是将当前元素与前面增量位置上的元素进行比较,然后,再将该元素插入到合适位置。当一趟希尔排序完成后,处于增量位置上的元素是有序 ...
分类:
编程语言 时间:
2016-05-28 22:59:11
阅读次数:
175
基于位置信息的聚类算法介绍及模型选择百度百科聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科..
分类:
编程语言 时间:
2016-05-27 14:55:36
阅读次数:
5611
Nginx版本:1.9.1
算法介绍
当后端是缓存服务器时,经常使用一致性哈希算法来进行负载均衡。
使用一致性哈希的好处在于,增减集群的缓存服务器时,只有少量的缓存会失效,回源量较小。
在nginx+ats / haproxy+squid等CDN架构中,nginx/haproxy所使用的负载均衡算法便是一致性哈希。
我们举个例子来说明一致性哈希的好处。
假设后端集群...
分类:
其他好文 时间:
2016-05-27 12:47:57
阅读次数:
234