码迷,mamicode.com
首页 >  
搜索关键字:大数据 sqoop 数据处理    ( 17411个结果
大数据Lambda架构
1 Lambda架构介绍 Lambda架构划分为三层,分别是批处理层,服务层,和加速层。最终实现的效果,可以使用下面的表达式来说明。 query = function(alldata) 1.1 批处理层 批处理层主用由Hadoop来实现,负责数据的存储和产生任意的视图数据。计算视图数据是一个联系操作,因此,当新数据到达时,使用MapReduce迭代地将数据聚集到视图中。 从整个数据集中计算...
分类:其他好文   时间:2014-05-11 07:29:44    阅读次数:419
< 转>百度与深度学习
作者余凯,百度技术副总监,千人计划国家特聘专家。贾磊,百度主任架构师,语音技术负责人。陈雨强,百度商务搜索部资深研发工程师,负责搜索广告 CTR 预估 摘要:深度学习带来了机器学习的新浪潮,推动“大数据+深度模型”时代的来临,以及人工智能和人机交互大踏步前进。如果我们能在理论、建模和工程方面突破深度...
分类:其他好文   时间:2014-05-11 07:27:45    阅读次数:389
Hadoop 学习资料集锦
Hadoop 资料虾皮系列教程。Sqoop 资料官方安装文档。浪迹天涯博客。……
分类:其他好文   时间:2014-05-11 01:07:23    阅读次数:298
练手题,没事就来AC吧 poj 4044 Score Sequence
此题为12年金华邀请赛A题克隆了下比赛,A题最简单,也是最挑战人数据处理能力的一题,可惜自己数据处理能力太弱久久不能写出代码…………总结下就是题做少了,平时应多做题,少灌水,应放下看电影的时间,玩各种软件的时间先做好一项再说才是正道,看到一句话说得好“ 人有两条路要走,一条是必须走的,一条是想走的,...
分类:其他好文   时间:2014-05-11 00:24:02    阅读次数:349
SQL 数据插入、删除 大数据
--测试表CREATE TABLE [dbo].[Employee] ( [EmployeeNo] INT PRIMARY KEY, [EmployeeName] [nvarchar](50) NULL, [CreateUser] [nvarchar](50) NULL, [...
分类:数据库   时间:2014-05-10 19:23:09    阅读次数:451
胖子哥的大数据之路(11)-我看Intel&&Cloudera的合作
技术能力到业务价值的转化,是当今大数据传统行业实践面临的首要问题,经过这些年的发展大数据平台本身已经相对成熟,已经基本具备生产应用的可能。从实际项目的实践情况来看,成熟的也仅限平台框架本身,应用支撑实施工具层面的匮乏,使得大数据技术的企业应用很难做到如传统SQL技术一样的工程化,易用化。目前大部分厂...
分类:其他好文   时间:2014-05-10 18:07:06    阅读次数:398
Rs2008内存管理策略
Rs2008 在内存管理方面已经有了很大的改变。主要增加了文件缓存,允许把内存数据卸载到文件缓存中。而Rs2005 都是把数据放到内存中。对于大数据量的报表而言,很容易出现OutOfMemory 错误。在实际应用中,发现Rs2008 也经常出现 OutOfMemory 错误。主要有以下几个原因:1 ...
分类:其他好文   时间:2014-05-10 08:14:31    阅读次数:317
几种数据库的大数据批量插入
IProvider里有一个用于实现批量插入的插件服务接口IBatcherProvider,此接口在前一篇文章中已经提到过了。/// /// 提供数据批量处理的方法。 /// public interface IBatcherProvider : IProviderService...
分类:数据库   时间:2014-05-10 06:28:39    阅读次数:518
MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)
声明: 若要转载, 请标明出处. 前提: 在对于大量的数据导入到HBase中, 如果一条一条进行插入, 则太耗时了, 所以可以先采用MapReduce生成HFile文件, 然后使用BulkLoad导入HBase中.  引用: 一、这种方式有很多的优点: 1. 如果我们一次性入库hbase巨量数据,处理速度慢不说,还特别占用Region资源, 一个比较高效便捷的方法就是使用 “Bulk...
分类:其他好文   时间:2014-05-10 04:33:38    阅读次数:513
数据挖掘之定义
大数据是2012的时髦词汇,正受到越来越多人的关注和谈论。大数据之所以受到人们的关注和谈论,是因为隐藏在大数据后面超千亿美元的市场机会。   大数据时代,数据挖掘是最关键的工作。以下内容供个人学习用,感兴趣的朋友可以看一下。   智库百科是这样描述数据挖掘的“数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并...
分类:其他好文   时间:2014-05-09 22:46:58    阅读次数:338
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!