码迷,mamicode.com
首页 >  
搜索关键字:mahout hadoop canopy 聚类 大数据    ( 26726个结果
MongoDB简单操作
Hadoop核心技术厂商Cloudera将在2014/06推出hadoop Ecosystem与MongoDB的整合产品,用MongoDB与ipmala及hbase,hive一起用;开源linux领军企业RHEL也宣布RHEL将整合MongoDB用于简化用户账号管理与LDAP一起用;1,基于命令行的...
分类:数据库   时间:2014-05-12 11:45:03    阅读次数:457
SQL 数据插入、删除 大数据
--测试表CREATE TABLE [dbo].[Employee] ( [EmployeeNo] INT PRIMARY KEY, [EmployeeName] [nvarchar](50) NULL, [CreateUser] [nvarchar](50) NULL, [...
分类:数据库   时间:2014-05-10 19:23:09    阅读次数:451
胖子哥的大数据之路(11)-我看Intel&&Cloudera的合作
技术能力到业务价值的转化,是当今大数据传统行业实践面临的首要问题,经过这些年的发展大数据平台本身已经相对成熟,已经基本具备生产应用的可能。从实际项目的实践情况来看,成熟的也仅限平台框架本身,应用支撑实施工具层面的匮乏,使得大数据技术的企业应用很难做到如传统SQL技术一样的工程化,易用化。目前大部分厂...
分类:其他好文   时间:2014-05-10 18:07:06    阅读次数:398
Rs2008内存管理策略
Rs2008 在内存管理方面已经有了很大的改变。主要增加了文件缓存,允许把内存数据卸载到文件缓存中。而Rs2005 都是把数据放到内存中。对于大数据量的报表而言,很容易出现OutOfMemory 错误。在实际应用中,发现Rs2008 也经常出现 OutOfMemory 错误。主要有以下几个原因:1 ...
分类:其他好文   时间:2014-05-10 08:14:31    阅读次数:317
几种数据库的大数据批量插入
IProvider里有一个用于实现批量插入的插件服务接口IBatcherProvider,此接口在前一篇文章中已经提到过了。/// /// 提供数据批量处理的方法。 /// public interface IBatcherProvider : IProviderService...
分类:数据库   时间:2014-05-10 06:28:39    阅读次数:518
Hadoop配置文件与HBase配置文件
本Hadoop与HBase集群有1台NameNode, 7台DataNode 1. /etc/hostname文件  NameNode:        node1 DataNode 1:        node2 DataNode 2:        node3 ....... DataNode 7:        node8 2. /etc/hosts文件 N...
分类:其他好文   时间:2014-05-10 04:55:08    阅读次数:386
Hadoop学习:Map/Reduce初探与小Demo实现
一、    概念知识介绍         Hadoop MapReduce是一个用于处理海量数据的分布式计算框架。这个框架解决了诸如数据分布式存储、作业调度、容错、机器间通信等复杂问题,可以使没有并行 处理或者分布式计算经验的工程师,也能很轻松地写出结构简单的、应用于成百上千台机器处理大规模数据的并行分布式程序。        Hadoop MapReduce基于“分而治之”的思想,将计算任务...
分类:其他好文   时间:2014-05-10 04:39:09    阅读次数:570
Hadoop与HBase中遇到的问题
1. Hadoop中遇到的问题 以前所遇到的问题由于没有记录,所以忘了  (1)NameNode没有启动成功, 是由于你对HDFS多次格式化,导致datanode中与namenode中的VERSION文件中的namespaceID不一致(对于NameNode节点,该文件位于hdfs-site配置文件中dfs.name.dir参数所指定的路径下的current文件夹中, 对于DataNode节点...
分类:其他好文   时间:2014-05-10 04:28:25    阅读次数:475
R语言聚类(K-Means、层次)
R语言聚类K-Means1、 随机生成3个簇点> c1=cbind(rnorm(20,2,1),rnorm(20,2,1))> c2=cbind(rnorm(20,3,2),rnorm(20,15,3))> c3=cbind(rnorm(20,20,2),rnorm(20,20,3))> v=rbi...
分类:其他好文   时间:2014-05-10 02:58:50    阅读次数:603
VMware 下扩展linux硬盘空间
很多人在学习Nutch、Hadoop或者熟悉Linux操作系统时都会选择在VMWare上安装Linux虚拟机,而又往往不想分配给Linux虚拟机足够大的硬盘空间,这就容易导致使用Linux一段时间后,发现虚拟机上的硬盘空间不够了,此时怎么解决?有的人直接选择了重新安装Linux虚拟机,但是下一次硬盘又不够了呢,还要重新安装操作系统吗,那再下一次呢?这种方法势必会进入一个重复无聊的过程,除了增加安装...
分类:系统相关   时间:2014-05-09 21:52:40    阅读次数:526
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!