一:为什么要预处理数据?
(1)现实世界的数据是肮脏的(不完整,含噪声,不一致)
(2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高质量的数据;数据仓库需要对高质量的数据进行一致地集成)
(3)原始数据中存在的问题:
不一致 —— 数据内含出现不一致情况
重复
不完整 —— 感兴趣的属性没有
含噪声 —— 数据中存在着错误、或异常(偏离期望值)的数据
高维度...
分类:
其他好文 时间:
2014-12-23 12:31:19
阅读次数:
193
Ext.data.Store是extjs中用来进行数据交换和数据交互的标准中间件,无论是Grid还是ComboBox,都是通过它 实现数据读取、类型转换、排序分页和搜索等操作的。
Ext.define('User', {
extend: 'Ext.data.Model',
fields: [
{name: 'loginname', type: 'string'},...
分类:
Web程序 时间:
2014-12-23 10:30:02
阅读次数:
203
一、线性回归1、什么是线性回归?(1)线性:直线(2)线性回归:根据已有的数据集拟合出一条直线(3)用途:回归或者分类,如果y是连续的值,则为回归;如果y是离散的几个值,则为分类;本文只针对分类(4)线性公式 ,设置x0=1,则有(5)如果利用线性回归进行回归或者分类,只需要估算出θ的值2、如何估算...
分类:
其他好文 时间:
2014-12-23 00:10:30
阅读次数:
254
在C++ 中使用 vector:容器或叫向量。对用来管理不定长度的数据集或经常变化的数据组,很方便。可以简单的理解他是一种数据组,一种数据类型的集合。vector是同一种类型的对象的集合。它相当于一个动态的数组, 当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的。...
分类:
编程语言 时间:
2014-12-22 22:40:52
阅读次数:
231
即时通讯系统一般分为客户端与服务端,客户端较轻,关键逻辑在服务端,一般分为三到四层,采用B/S和C/S混合架构。
连接层:Connector连接集群。连接层需要尽可能简单,采用同步/异步多种方案,来支撑高并发与高在线。连接层需要承担的总连数可能超过1000万。
逻辑层:关键逻辑与业务逻辑、应用逻辑分离,将即时通讯的功能模块化颗粒化,抽象基础逻辑组件,在基础组件基础上构建业务逻辑子群。
数据层:根据逻辑层的模块化,设计对应的服务化数据集群,在逻辑和物理上对数据进行隔离存放。
监控层:将监控嵌入基础框架,多层进...
分类:
其他好文 时间:
2014-12-22 21:20:47
阅读次数:
420
为了让 PL/SQL 函数返回数据的多个行,必须通过返回一个 REF CURSOR 或一个数据集合来完成。REF CURSOR 的这种情况局限于可以从查询中选择的数据,而整个集合在可以返回前,必须进行具体化。Oracle 9i 通过引入的管道化表函数纠正了后一种情况。表函数是返回整个行的集(通常作为...
分类:
数据库 时间:
2014-12-22 15:52:47
阅读次数:
223
由于写论文需要数据,而网络上所能下载到的flickr数据集不符合要求。所以决定自己下载,也可以供实验室其他人使用。Flickr提供了一套API方便企业或者个人用户访问经过用户授权的数据。而单纯下载数据不需要使用OAuth,十分方便。 当然是在没有国家防火墙的情况下十分方便。 Flickr是在国家防....
分类:
编程语言 时间:
2014-12-22 12:34:33
阅读次数:
707
原文:SQL Server调优系列基础篇(子查询运算总结)前言
前面我们的几篇文章介绍了一系列关于运算符的介绍,以及各个运算符的优化方式和技巧。其中涵盖:查看执行计划的方式、几种数据集常用的连接方式、联合运算符方式、并行运算符等一系列的我们常见的运算符。有兴趣的童鞋可以点击查看。
本篇我们介绍关于子...
分类:
数据库 时间:
2014-12-22 09:24:48
阅读次数:
224
原文:SQL Server调优系列进阶篇(查询优化器的运行方式)前言
前面我们的几篇文章介绍了一系列关于运算符的基础介绍,以及各个运算符的优化方式和技巧。其中涵盖:查看执行计划的方式、几种数据集常用的连接方式、联合运算符方式、并行运算符等一系列的我们常见的运算符。有兴趣的童鞋可以点击查看。
本篇介绍...
分类:
数据库 时间:
2014-12-22 09:19:25
阅读次数:
199
第十章视图1.视图:从表中抽出的逻辑上相关的数据集合。视图是一种虚表。视图建立在已有表的基础上,视图赖以建立的这些表称为基表。向视图提供数据内容的语句为SELECT语句,可以将视图理解为存储起来的SELECT语句.视图向用户提供基表数据的另一种表现形式2.为什么使用视图控制数..
分类:
数据库 时间:
2014-12-22 07:10:04
阅读次数:
248