码迷,mamicode.com
首页 >  
搜索关键字:数据集    ( 7694个结果
BigData预处理(步骤)
一:为什么要预处理数据? (1)现实世界的数据是肮脏的(不完整,含噪声,不一致) (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高质量的数据;数据仓库需要对高质量的数据进行一致地集成) (3)原始数据中存在的问题: 不一致 —— 数据内含出现不一致情况 重复 不完整 —— 感兴趣的属性没有 含噪声 —— 数据中存在着错误、或异常(偏离期望值)的数据 高维度...
分类:其他好文   时间:2014-12-23 12:31:19    阅读次数:193
ExtJs4学习(七)MVC中的Store
Ext.data.Store是extjs中用来进行数据交换和数据交互的标准中间件,无论是Grid还是ComboBox,都是通过它 实现数据读取、类型转换、排序分页和搜索等操作的。 Ext.define('User', { extend: 'Ext.data.Model', fields: [ {name: 'loginname', type: 'string'},...
分类:Web程序   时间:2014-12-23 10:30:02    阅读次数:203
线性回归
一、线性回归1、什么是线性回归?(1)线性:直线(2)线性回归:根据已有的数据集拟合出一条直线(3)用途:回归或者分类,如果y是连续的值,则为回归;如果y是离散的几个值,则为分类;本文只针对分类(4)线性公式 ,设置x0=1,则有(5)如果利用线性回归进行回归或者分类,只需要估算出θ的值2、如何估算...
分类:其他好文   时间:2014-12-23 00:10:30    阅读次数:254
备忘: C++中的 vector 容器
在C++ 中使用 vector:容器或叫向量。对用来管理不定长度的数据集或经常变化的数据组,很方便。可以简单的理解他是一种数据组,一种数据类型的集合。vector是同一种类型的对象的集合。它相当于一个动态的数组, 当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的。...
分类:编程语言   时间:2014-12-22 22:40:52    阅读次数:231
即时通讯架构研究
即时通讯系统一般分为客户端与服务端,客户端较轻,关键逻辑在服务端,一般分为三到四层,采用B/S和C/S混合架构。 连接层:Connector连接集群。连接层需要尽可能简单,采用同步/异步多种方案,来支撑高并发与高在线。连接层需要承担的总连数可能超过1000万。 逻辑层:关键逻辑与业务逻辑、应用逻辑分离,将即时通讯的功能模块化颗粒化,抽象基础逻辑组件,在基础组件基础上构建业务逻辑子群。 数据层:根据逻辑层的模块化,设计对应的服务化数据集群,在逻辑和物理上对数据进行隔离存放。 监控层:将监控嵌入基础框架,多层进...
分类:其他好文   时间:2014-12-22 21:20:47    阅读次数:420
Oracle Split 函数
为了让 PL/SQL 函数返回数据的多个行,必须通过返回一个 REF CURSOR 或一个数据集合来完成。REF CURSOR 的这种情况局限于可以从查询中选择的数据,而整个集合在可以返回前,必须进行具体化。Oracle 9i 通过引入的管道化表函数纠正了后一种情况。表函数是返回整个行的集(通常作为...
分类:数据库   时间:2014-12-22 15:52:47    阅读次数:223
使用python调用flickrAPI获取数据
由于写论文需要数据,而网络上所能下载到的flickr数据集不符合要求。所以决定自己下载,也可以供实验室其他人使用。Flickr提供了一套API方便企业或者个人用户访问经过用户授权的数据。而单纯下载数据不需要使用OAuth,十分方便。 当然是在没有国家防火墙的情况下十分方便。 Flickr是在国家防....
分类:编程语言   时间:2014-12-22 12:34:33    阅读次数:707
SQL Server调优系列基础篇(子查询运算总结)
原文:SQL Server调优系列基础篇(子查询运算总结)前言 前面我们的几篇文章介绍了一系列关于运算符的介绍,以及各个运算符的优化方式和技巧。其中涵盖:查看执行计划的方式、几种数据集常用的连接方式、联合运算符方式、并行运算符等一系列的我们常见的运算符。有兴趣的童鞋可以点击查看。 本篇我们介绍关于子...
分类:数据库   时间:2014-12-22 09:24:48    阅读次数:224
SQL Server调优系列进阶篇(查询优化器的运行方式)
原文:SQL Server调优系列进阶篇(查询优化器的运行方式)前言 前面我们的几篇文章介绍了一系列关于运算符的基础介绍,以及各个运算符的优化方式和技巧。其中涵盖:查看执行计划的方式、几种数据集常用的连接方式、联合运算符方式、并行运算符等一系列的我们常见的运算符。有兴趣的童鞋可以点击查看。 本篇介绍...
分类:数据库   时间:2014-12-22 09:19:25    阅读次数:199
Oracle基础笔记十
第十章视图1.视图:从表中抽出的逻辑上相关的数据集合。视图是一种虚表。视图建立在已有表的基础上,视图赖以建立的这些表称为基表。向视图提供数据内容的语句为SELECT语句,可以将视图理解为存储起来的SELECT语句.视图向用户提供基表数据的另一种表现形式2.为什么使用视图控制数..
分类:数据库   时间:2014-12-22 07:10:04    阅读次数:248
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!