搜索关键字：大数据 hadoop apark flume kafka，搜索到29364个结果！码迷,mamicode.com！

SQL 数据插入、删除大数据

--测试表CREATE TABLE [dbo].[Employee] ( [EmployeeNo] INT PRIMARY KEY, [EmployeeName] [nvarchar](50) NULL, [CreateUser] [nvarchar](50) NULL, [...

分类：数据库时间：2014-05-10 19:23:09 阅读次数：451

Rs2008内存管理策略

Rs2008 在内存管理方面已经有了很大的改变。主要增加了文件缓存，允许把内存数据卸载到文件缓存中。而Rs2005 都是把数据放到内存中。对于大数据量的报表而言，很容易出现OutOfMemory 错误。在实际应用中，发现Rs2008 也经常出现 OutOfMemory 错误。主要有以下几个原因：1 ...

分类：其他好文时间：2014-05-10 08:14:31 阅读次数：317

几种数据库的大数据批量插入

IProvider里有一个用于实现批量插入的插件服务接口IBatcherProvider，此接口在前一篇文章中已经提到过了。/// /// 提供数据批量处理的方法。 /// public interface IBatcherProvider : IProviderService...

分类：数据库时间：2014-05-10 06:28:39 阅读次数：518

Hadoop配置文件与HBase配置文件

本Hadoop与HBase集群有1台NameNode, 7台DataNode 1. /etc/hostname文件 NameNode: node1 DataNode 1: node2 DataNode 2: node3 ....... DataNode 7: node8 2. /etc/hosts文件 N...

分类：其他好文时间：2014-05-10 04:55:08 阅读次数：386

Hadoop学习：Map/Reduce初探与小Demo实现

一、概念知识介绍 Hadoop MapReduce是一个用于处理海量数据的分布式计算框架。这个框架解决了诸如数据分布式存储、作业调度、容错、机器间通信等复杂问题，可以使没有并行处理或者分布式计算经验的工程师，也能很轻松地写出结构简单的、应用于成百上千台机器处理大规模数据的并行分布式程序。 Hadoop MapReduce基于“分而治之”的思想，将计算任务...

分类：其他好文时间：2014-05-10 04:39:09 阅读次数：570

Hadoop与HBase中遇到的问题

1. Hadoop中遇到的问题以前所遇到的问题由于没有记录,所以忘了 (1)NameNode没有启动成功, 是由于你对HDFS多次格式化,导致datanode中与namenode中的VERSION文件中的namespaceID不一致(对于NameNode节点,该文件位于hdfs-site配置文件中dfs.name.dir参数所指定的路径下的current文件夹中, 对于DataNode节点...

分类：其他好文时间：2014-05-10 04:28:25 阅读次数：475

数据挖掘之定义

大数据是2012的时髦词汇，正受到越来越多人的关注和谈论。大数据之所以受到人们的关注和谈论，是因为隐藏在大数据后面超千亿美元的市场机会。　　大数据时代，数据挖掘是最关键的工作。以下内容供个人学习用，感兴趣的朋友可以看一下。　　智库百科是这样描述数据挖掘的“数据挖掘又称数据库中的知识发现，是目前人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并...

分类：其他好文时间：2014-05-09 22:46:58 阅读次数：338

在Form域中Post大于100K的数据

在Form域中Post大于100K的数据当表单发送的数据量很大时，就会报错。查阅MSDN了解到，原因是微软对用Request.Form()可接收的最大数据有限制，IIS4中为80K字节，IIS5中为100K字节。　　下面是微软提供的几个解决方法: 1、用Request.BinaryRead 代替 Request.Form方法来解析表单数据； 2、使用文件上传方案，比如：Microso...

分类：其他好文时间：2014-05-09 22:13:58 阅读次数：348

VMware 下扩展linux硬盘空间

很多人在学习Nutch、Hadoop或者熟悉Linux操作系统时都会选择在VMWare上安装Linux虚拟机，而又往往不想分配给Linux虚拟机足够大的硬盘空间，这就容易导致使用Linux一段时间后，发现虚拟机上的硬盘空间不够了，此时怎么解决？有的人直接选择了重新安装Linux虚拟机，但是下一次硬盘又不够了呢，还要重新安装操作系统吗，那再下一次呢？这种方法势必会进入一个重复无聊的过程，除了增加安装...

分类：系统相关时间：2014-05-09 21:52:40 阅读次数：526

Hive ERROR: Out of memory due to hash maps used in map-side aggregation

当hive在执行大数据量的统计查询语句时，经常会出现下面OOM错误，具体错误提示如下： Possible error: Out of memory due to hash maps used in map-side aggregation. Solution: Currently hive.map.aggr.hash.percentmemory is set to 0.5. Try set...

分类：其他好文时间：2014-05-09 21:08:27 阅读次数：366

共29364条上一页 1 ... 2919 2920 2921 2922 2923 ... 2937 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)