码迷,mamicode.com
首页 >  
搜索关键字:大数据 sqoop 数据处理    ( 17411个结果
MongoDB分片之数据分割方式
随着移动互联网的发展,大量的非结构化数据随之产生,不仅对数据库存储大数据提出了新的要求,同时对于查询数据和进行大数据分析也提出了苛刻的要求,这些显然是单服务器处理能力无法满足的,自然建立一个集群是不可避免的。集群的复杂性大家众所周知,而MongoDB的优势之一正式可以帮助我们解决这些问题。分片(sh...
分类:数据库   时间:2014-07-12 13:00:54    阅读次数:267
Google云平台对于2014世界杯半决赛的预测,德国阿根廷胜!
由于本人是个足球迷,前段日子Google利用自己云平台预测世界杯八进四的比赛并取得了75%的正确率的事情让我振动不小。虽然这些年一直听说大数据的预测和看趋势能力如何如何强大,但这次的感受更加震撼,因为世界杯是很多人都在关注并尝试去预测的比赛,Google云平台在这个时候站出来预测比赛无疑很让人充满期...
分类:其他好文   时间:2014-07-12 00:14:33    阅读次数:233
wcf webHttpBinding Post
wcf webHttpBinding Post 大数据量提交 ios c#客户端一直在为安卓和苹果写服务,刚开始的时候全用的Get请求用url传所有的参数,由于url长度的限制大的数据量无法传到服务器,提交图片什么的就更不用说了,后来用的POST请求,记录一下,做了一个很简单的小例子:c#源代码提供...
分类:Web程序   时间:2014-07-11 19:20:06    阅读次数:312
[已解决]C#批量高效率导入大数据到数据库[百万级以上]
将几百万条数据导入到数据库中,怎么样高效率的导入?下面我就介绍一个高效率的方法:1、将数据库文件(DB.csv)导入到DataTable中:/// /// 将CSV文件的数据读取到DataTable中 /// /// CSV文件路径 ///...
分类:数据库   时间:2014-07-11 10:33:04    阅读次数:252
storm学习之入门篇(一)
海量数据处理使用的大多是鼎鼎大名的hadoop或者hive,作为一个批处理系统,hadoop以其吞吐量大、自动容错等优点,在海量数据处理上得到了广泛的使用。但是,hadoop不擅长实时计算,因为它天然就是为批处理而生的,这也是业界一致的共识。否则最近这两年也不会有s4,storm,puma这些实时计...
分类:其他好文   时间:2014-07-11 10:00:17    阅读次数:213
Hive学习路线图
Hive学习路线图Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, C...
分类:其他好文   时间:2014-07-11 08:48:52    阅读次数:291
mysql merge表介绍
在Mysql数据库中,Mysql Merge表有点类似于视图。下面就让我们来一起了解一下Mysql Merge表都有哪些优点,希望对您能有所帮助。 Mysql Merge表的优点: A: 分离静态的和动态的数据 B:利用结构接近的的数据来优化查询 C: 查询时可以访问更少的数据 D:更容易维护大数据集 E: 可以通过修改.mrg文件来修改Merge表,当然也可以用alter进行修改...
分类:数据库   时间:2014-07-10 23:53:04    阅读次数:313
(转)Hadoop生态系统
以下图1是hadoop生态图,通俗的说,就是hadoop核心模块和衍生的子项目。 图 1 Hadoop生态系统图由图可知,hadoop生态系统包括以下成员:① 各种浏览器,产生海量的Web数据;② Nutch项目,一个快速搜索海量网页的开源项目③ HDFS,Hadoop分布式文件系统,大数据的存储系...
分类:其他好文   时间:2014-07-10 15:32:23    阅读次数:189
Visual Prolog 的 Web 专家系统 (3)
深入探究WEB GENI源程序 折腾WEB GENI的目的,是为了摸清它的构造设计、运行机制,为山寨出自己的专家系统外壳,积累经验,启发灵感。 为此,必须深入细致地研读源程序代码。 WEBGENI包括2个模块:geni.pro和cgitools.pro。前者是主程序,负责推理、生成网页等;后者负责相对底层的CGI数据处理。本文探究的对象,主要是geni.pro。 Visual Prol...
分类:Web程序   时间:2014-07-09 12:57:04    阅读次数:249
大云之下-----新技术下的网络变革
最近一直在构思这样的一个胶片,主要是从大数据,云计算的发展来看底层网络的变革。众所周知,一般一个新的技术,都会先在运营商里使用,然后才会在一些大的政企或特殊行业使用。特别是现在的大数据与云计算的兴起,势必会对网络提出一个大的变革。互联网厂商一般都是与业务相..
分类:其他好文   时间:2014-07-09 08:07:56    阅读次数:226
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!