RDD详解RDD(Resilient Distributed Datasets弹性分布式数据集),是spark中最重要的概念,可以简单的把RDD理解成一个提供了许多操作接口的数据集合,和一般数据集不同的是,其实际数据分布存储于一批机器中(内存或磁盘中)。当然,RDD肯定不会这么简单,它的功能还包括容...
分类:
其他好文 时间:
2014-11-29 15:54:31
阅读次数:
252
1、什么是进程?狭义定义:进程就是一段程序的执行过程。广义定义:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。在传统操作系统中,进程作为资源分配和独立运行的基本单元。2、每个进程的地址空间都一样吗?地址空间都包括哪些内容?每一个进程都有它自己的地址空间,一般情况下,包括文本区域(t...
分类:
编程语言 时间:
2014-11-28 09:55:39
阅读次数:
173
K-means聚类算法算法优缺点:优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,...
分类:
编程语言 时间:
2014-11-28 06:13:30
阅读次数:
368
1 # 创建数据集,5*7的矩阵 2 def loadExData(): 3 return [[1,1,1,0,0], 4 [2,2,2,0,0], 5 [1,1,1,0,0], 6 [5,5,5,0,0], 7 ...
分类:
编程语言 时间:
2014-11-27 17:40:40
阅读次数:
367
在Yii的开发中常常需要去使用Yii的增删改查方法,这些方法又可以多次变化和组合,带来全方位的实现对数据库的处理,下面对这些方法做一些简单的整理和梳理,有遗漏或是BUG,敬请指出。灰常感谢!!!
一、查询数据集合
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//1.该方法是根据...
分类:
数据库 时间:
2014-11-27 12:46:35
阅读次数:
275
在实际编程中,往往存在着这样的“数据集”,它们的数值在程序中是稳定的,而且“数据集”中的元素是有限的。
例如星期一到星期日七个数据元素组成了一周的“数据集”,春夏秋冬四个数据元素组成了四季的“数据集”。
在java中如何更好的使用这些“数据集”呢?因此枚举便派上了用场,以下代码详细介绍了枚举的用法。
package com.ljq.test;
/**
* 枚举用法详解
*...
分类:
编程语言 时间:
2014-11-27 12:44:03
阅读次数:
181
数据完整性分类1.域完整性域完整性又称为列完整性,指定一个数据集对某一个列是否有效和确定是否允许空值。2.实体完整性实体完整性也可称为行完整性,要求表中每一行有一个唯一的标识符,即primarykey。3.参照完整性又称之为引用完整性。主键和唯一键的主要区别:(1)一个数据..
分类:
数据库 时间:
2014-11-27 06:56:53
阅读次数:
364
1. 类图 2. 总结 迭代器模式用于客户端程序用统一的方式遍历各种数据集合,而不需要知道数据集合的实现,同时可以自由扩充数据集合。每一种数据集合都需要单独实现一个针对与自身类型的迭代器。
分类:
其他好文 时间:
2014-11-26 22:30:42
阅读次数:
217
2、WEB端部署集算报表在web端部署流程与一般J2EE应用部署流程基本一致,包括:如果和已有应用集成,一般来说已有应用已经配置好了数据库连接池,因此第一、第二步骤可以省略,只需要后面几个步骤。配置应用服务器的数据库连接池、发布报表应用这两个步骤在不同应用服务器中的操..
分类:
其他好文 时间:
2014-11-26 19:14:46
阅读次数:
423
HDFS提供分布式存储机制,提供可线性增长的海量存储能力自动数据冗余,无须使用Raid,无须另行备份为进一步分析计算提供数据基础HDFS设计基础与目标硬件错误是常态,因此需要冗余流式数据访问.即数据批量读取而非随机读写,hadoop擅长做的是数据分析而不是事务处理大规模数据集简单..
分类:
其他好文 时间:
2014-11-26 06:49:42
阅读次数:
223