现有的hadoop生态系统中存在的问题1)使用mapreduce进行批量离线分析;2)使用hive进行历史数据的分析;3)使用hbase进行实时数据的查询;4)使用storm进行实时的流处理;5)。。。。。。导致:维护成本高、学习成本高Spark的出现弥补了Hadoop生态系统中的缺陷,使用spar...
分类:
其他好文 时间:
2014-06-28 14:08:46
阅读次数:
306
2014-06-20 BaoXinjian一、摘要有关表分区的一些维护性操作:注:分区根据具体情况选择。表分区有以下优点:1、数据查询:数据被存储到多个文件上,减少了I/O负载,查询速度提高。2、数据修剪:保存历史数据非常的理想。3、备份:将大表的数据分成多个文件,方便备份和恢复。4、并行性:可以同...
分类:
数据库 时间:
2014-06-23 07:51:34
阅读次数:
366
以下内容大部分来自:http://blog.csdn.net/tjvictor/article/details/4360030部分内容出自互联网,实验结果为亲测。 最近自己开发一个向数据库中插入大量历史数据的函数库,需要解决一个大数据量插入的效率问题。不用分析,我知道如果采取逐条数据插入的方式,那么...
分类:
数据库 时间:
2014-06-18 17:05:26
阅读次数:
278
推荐系统,主要采用对历史数据的分析计算,得到某种模型,对未来的数据进行预测。说到底,还是分类问题。
Mahout,是一个可扩展的机器学习库,可用于单机,也可用于Hadoop。
Mahout的API非常简单,实现一个推荐功能只需要如下的几行代码:
DataModel model = new FileDataModel(new File(file));//建立数据模型
UserSimil...
分类:
其他好文 时间:
2014-06-15 12:35:30
阅读次数:
193
playground实时展示swift语言执行情况,对于程序循环的历史数据变量比较,可以用XCPCaptureValue进行捕捉并作图对比。
分类:
其他好文 时间:
2014-06-10 16:12:56
阅读次数:
171
生产环境:AIX 5.3 + Oracle
10.2.0.5任务要求:普通表改造分区表,历史数据不要这个需求很简单:pl/sql导出建表语句,依次修改成分区的建表语句,注意将索引修改成本地索引;drop
原表;create 新分区表.1.重建过程中遇到问题:删除某表时报错ORA-00054,导致无法...
分类:
其他好文 时间:
2014-06-07 04:21:53
阅读次数:
244
ASH和AWR的关系
ASH以V$SESSION为基础,每秒采样一次,记录活动会话等待的事件。不活动的会话不会采样,采样工作由新引入的后台进程MMNL来完成。
ASH内存记录数据始终是有限的,为了保存历史数据,引入了自动负载信息库(Automatic Workload Repository ,AWR) 由后台进程MMON完成。ASH信息同样被采集写出到AWR负载库中。由于内存是有限的,所以MM...
分类:
数据库 时间:
2014-05-25 07:06:13
阅读次数:
377
此页面为WP8“我爱世界杯”应用的发布页面。“我爱世界杯”是一款介绍2014巴西世界杯的WP8端软件。主要有比赛时间提醒、精彩回放、关注热点、球星介绍、历史数据等方面。此页面主要记录开发进度、APP发布等情况。-------------------相关进度---------------------目...
分类:
其他好文 时间:
2014-05-24 09:31:01
阅读次数:
215
随着大数据时代的到来,我们越来越多的使用电子产品,使我们的活动信息被越来越多的收集起来。我们知道,机器学习的一大目标就是利用历史数据去预测未来,那么,我们的行为会不会被预测呢?...
分类:
其他好文 时间:
2014-05-22 22:43:12
阅读次数:
557
ocm02库与GC安装与配置
安装顺序:ocmdb02库(host:ocm02)
1.安装ocmdb02库 作用:存放历史数据,用于历史分析 --后续安装oms,oms需要一个容器来存放各个agent推送来的信息,ocmdb02就是这个容器。
2.配置oracle用户环境变量
export ORACLE_BASE=/u01/oracle
export ORACLE_HOME=$ORACLE_BASE/product/10.2.0/db_1
export LD_LIBRARY_PATH=$ORACLE_HOM...
分类:
其他好文 时间:
2014-05-15 05:52:11
阅读次数:
238