一、网站性能测试(1)性能测试指标:①响应时间;②并发数;③吞吐量;④性能计数器;(2)性能测试方法:①性能测试;②负载测试;③压力测试;④稳定性测试;(3)性能优化策略: ①性能分析:检查请求处理各个环节的日志,分析哪个环节响应时间不合理,检查监控数据分析影响性能的因素; ②性能优化:Web前.....
分类:
Web程序 时间:
2014-06-27 13:20:22
阅读次数:
365
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:
其他好文 时间:
2014-06-26 22:35:29
阅读次数:
298
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.背景 决策书算法是一种逼近离散数值的分类算法,思路比較简单,并且准确率较高。国际权威的学术组织,数据挖掘国际会议ICDM (the IEEE International Conference on Da...
分类:
编程语言 时间:
2014-06-26 22:33:33
阅读次数:
410
prunning,剪枝,顾名思义就是减掉那些不重要的。
从理论上来讲,剪枝达到的效果就是剪枝后的q和剪枝前的 p 最大化相似,有两种算法 entroy-based以及rank-based。
针对model,使用相对熵来刻画D(q||p) 来刻画,保证两个model的熵差别最小,就是entropy-based。如果使用rank(p|q)来描述,保证整个model的rank差别最小...
分类:
其他好文 时间:
2014-06-26 07:24:00
阅读次数:
208
问题导读:1. 推荐系统概述;2. 推荐系统指标设计;3. Hadoop并行算法;4. 推荐系统架构;5. MapReduce程序实现。前言Netflix电影推荐的百万美金比赛,把“推荐”变成了时下最热门的数据挖掘算法之一。也正是由于Netflix的比赛,让企业界和学科界有了更深层次的技术碰撞。引发...
分类:
其他好文 时间:
2014-06-25 09:46:57
阅读次数:
329
一。说明:
OLTP中有些表数据量大,而且会对历史数据进行迁移至OLAP中做数据挖掘。对这种历史数据迁移的操作,较好的办法是该表采用分区表。比如按时间分区后,可以对分区进行迁移。
通过分区交换和表空间传输会很容易完成,而且性能上影响很小。
关于分区表更多内容:http://blog.csdn.net/tanqingru/article/category/1397435
关于表空间传...
分类:
其他好文 时间:
2014-06-24 17:21:12
阅读次数:
260
本章概要
1探索R数据结构
2使用数据编辑器
3数据导入
4数据集标注...
分类:
其他好文 时间:
2014-06-22 22:38:29
阅读次数:
343
你只要想处理数据,《R实战》这本书就可以助你一臂之力。...
分类:
其他好文 时间:
2014-06-22 21:24:53
阅读次数:
158
基于微信公众平台数据分析,很容易发现,移动端工程师都喜欢关注互联网创业资讯。都说,一个不关注互联网创业的iOS开发不是一个合格的互联网人。
每一位开发都怀这一个创业的心,只是老板不知道而已,哈哈。
ok,废话少说,既然各位喜欢创业,预谋已久,那么,从今天开始,我们推出新栏目【看大牛】。
【看大牛】每一季记录一位草根创业史,回复“看大牛”,即可获得最新一位大牛创业史。...
分类:
微信 时间:
2014-06-22 20:51:44
阅读次数:
398
本章概要
1安装R
2理解R语言
3运行R程序...
分类:
其他好文 时间:
2014-06-21 22:19:18
阅读次数:
244