时间序列数据挖掘综述http://hi.baidu.com/superkiki1989/item/33d609ec4d936204560f1d14一、引言
时间序列是指按时间顺序排列的一组数据,是一类重要的复杂数据对象。作为数据库中的一种数据形式,它广泛存在于各种大型的商业、医学、工程和社会科学.....
分类:
其他好文 时间:
2014-05-27 00:11:44
阅读次数:
392
#includeusing namespace
std;///快排,百度数据挖掘,我面到终面///他们部门经理过来面我///数据挖掘的东西,兵来将挡,水来土掩////讲完项目于对互联网的理解///他说,最后写个快排吧~~~~////FUCK,我没写出来////嚓嚓嚓嚓嚓int
AdjustArray...
分类:
其他好文 时间:
2014-05-26 14:14:50
阅读次数:
174
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:
其他好文 时间:
2014-05-26 06:00:31
阅读次数:
239
现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不...
分类:
Web程序 时间:
2014-05-26 05:54:50
阅读次数:
393
星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式。本文主要介绍《广东省高速公路一张网资金结算情况分析系统》中的数据仓库技术。...
分类:
其他好文 时间:
2014-05-24 18:24:43
阅读次数:
297
创业者很苦鳖的,苦于创意,苦于开发,苦于用户体验。创业者很苦鳖的,就算把产品做好了,不推广也很难获得用户。创业者很苦鳖的,遇上无良渠道商,花钱做推广,花时间做换量,可产品还是不见起色。看看一个同样苦鳖的开发者赵学童鞋的自述吧。我做数据挖掘技术出身,并从事推广工作三年,App付费推广的作假现象已屡见不...
分类:
其他好文 时间:
2014-05-23 05:30:43
阅读次数:
262
1.数据挖掘是指从大量的数据中提取有用的知识信息的一种模式。(1)因为现在的生活工作中随时随刻都在产生大量的数据和都需要将这些数据转变为有用的信息和知识,是因为需求的不断增加才会突显出数据挖掘技术的重要性,所以数据挖掘应该是信息技术发展带来的结果。(2)数据挖掘应该是这些技术融合而不是简单的变革。(...
大数据的热门使得很多人都想往这个方向发展,做一些像数据挖掘,数据分析之类的工作。但是该从何开始呢?要怎样才能快速学到一些有用的知识,技能呢?我觉得有三个切入点,依照个人特点可以自行选择顺序切入。...
分类:
其他好文 时间:
2014-05-22 10:33:54
阅读次数:
232
随着网络信息时代的发展,数据转换技术也在不断的飞速发展。人们可以通过计算机与互联网联接,从世界各地实时的接收和发送大量、最新的信息,但在信息交换的过程中存在着一个突出的问题,就是多种多样的数据格式,给信息的有效使用带来了障碍。所以在信息时代,如何以最便捷、最可靠、最有效的方式获取所需的信息是一个很大的困扰。如何让用户在必要的时刻快速简单的得到必要的数据--HYFsoft(北京红樱枫软件有限公司)的数据格式转换技术日益受到社会的瞩目。...
分类:
其他好文 时间:
2014-05-22 10:20:13
阅读次数:
270
梦的表征、抽象的思维——《梦的解析》读后感
据我所知,人类最擅长的一件事就是抽象了。现在人工智能领域所做的工作,最常见的就是利用各种数学的模型解决一些现实生活中的问题。比如,我做过分析的一些东西:数据挖掘技术里面的聚类和分类。初始接触这些东西时的感觉就是玄之又玄,莫名其妙。当一步步接触之后,给我更....
分类:
其他好文 时间:
2014-05-21 17:36:26
阅读次数:
356