码迷,mamicode.com
首页 >  
搜索关键字:大数据处理    ( 465个结果
maven springmvc mybatis rest webservice bootstrap整合
mavenspringmvcshiromybatisrestwebservicebootstrap整合,模拟大型互联网架构,高并发,大数据处理,mavenspringmvcshiromybatisrestwebservicebootstrap整合使用定制化服务思想,提供原子化、模块化的方案,将功能模块进行拆分,可以公用到所有的项目中(手机appoaerp电子商..
分类:编程语言   时间:2015-05-01 12:11:21    阅读次数:626
基于Java的开源日志库log4j调研笔记
由于Hadoop生态链基本都是java开发的,所以在很多有关大数据处理的开源项目中,经常会看到log4j这个jar包。 本文旨在对它的用法做基本说明。 1. log4j是什么 从log4j的命名(log for java)不难看出,它是为java提供的日志库。具体而言,它是Apache基金会下的开源项目,它可在不修改应用程序代码的前提下,在程序运行时提供灵活的日志打印功能(当然,应用程序还是...
分类:编程语言   时间:2015-04-30 18:09:59    阅读次数:219
大数据处理算法三:分而治之/hash映射 + hash统计 + 堆/快速/归并排序
百度面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 IP 是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的 IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP中,找出那个频率最大的IP,即 为所求。   百度面试题2、搜...
分类:编程语言   时间:2015-04-29 19:53:53    阅读次数:192
大数据处理算法一:Bitmap算法
腾讯面试题:给20亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中并且所耗内存尽可能的少? ?解析:bitmap算法就好办多了 ?所谓bitmap,就是用每一位来存...
分类:编程语言   时间:2015-04-29 17:40:15    阅读次数:190
大数据处理算法一:Bitmap算法
腾讯面试题:给20亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中并且所耗内存尽可能的少?  解析:bitmap算法就好办多了  所谓bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。  例如,要判断一千万个人的状态,每个人只有两种状态:男人,女人,可以...
分类:编程语言   时间:2015-04-29 11:50:09    阅读次数:131
大数据处理算法二:Bloom Filter算法
百度面试题:给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。   一. 实例    为了说明Bloom Filter存在的重要意义,举一个实例...
分类:编程语言   时间:2015-04-29 11:36:59    阅读次数:177
阿里云服务(一)——OSS
阿里电子商务迄今是中国最大的电商网站,各个厂商都在去模仿。就像google的大数据处理,hadoop的思想等等,只有做出了一些成绩,起了带头羊,那么将会是非常吃香的。从今天开始简单学习了解一下阿里的各种云服务。今天先看一下OSS。         OSS(Open Storage Service)开放云存储服务,是阿里云对外的提供的海量,安全和高可靠的云存储服务。目前阿里的所有云服务都是收费,大家...
分类:其他好文   时间:2015-04-26 18:20:41    阅读次数:229
流式大数据处理的三种框架:Storm,Spark和Samza
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。Apache Storm 在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(ma...
分类:其他好文   时间:2015-04-17 07:05:30    阅读次数:152
系统小事——开篇
我打算写的这些东西,非框架,非业务,也不是高大上的大数据处理,或者流行的用户体验、交互设计,仅仅是关于一些系统设计的细节,比如为什么要做联机程序和批量程序,以及如何设计联机/批量?数据一致性保证,并行处理、参数的生命周期,存储过程该不该用、跨系统传输文件以什么方式来同步等等。也会有一些业务实现上的细...
分类:其他好文   时间:2015-04-15 18:40:04    阅读次数:108
maven构建springmvc+mybatis+rest+Webservice+bootstrap html5(开源CMS)
SpringMVC+Mybatis+SpringSecurity(权限控制到方法按钮)+Rest(服务)+Webservice(服务)+Quartz(定时调度)+Lucene(搜索引擎)+HTML5bootstrap+Maven项目构建绝对开源平台项目Mave构建,模拟大型互联网架构,做到高并发,大数据处理,整个项目使用定制化服务思想,提供原子化、..
分类:编程语言   时间:2015-04-11 06:40:31    阅读次数:266
465条   上一页 1 ... 34 35 36 37 38 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!