码迷,mamicode.com
首页 >  
搜索关键字:超人学院    ( 254个结果
solr相似匹配
在我们使用网页搜索时,会注意到每一个结果都包含一个“相似页面”链接,单击该链接,就会发布另一个搜索请求,查找出与起初结果类似的文档。Solr使用MoreLikeThisComponent(MLT)和MoreLikeThisHandler实现了一样的功能。如上所述,MLT是与标准SolrRequestHandler集成在一起..
分类:其他好文   时间:2015-05-27 19:20:19    阅读次数:241
pig---用户自定义函数(UDF)
用户自定义函数(UDF)publicabstractclassEvalFunc<T>{publicabstractTexec(Tupleinput)throwsIOException;publicList<FuncSpec>getAvgToFuncMapping()throwsFrontendException;publicFuncSpecoutputSchema()throwsFrontendException;}输入元组的字段包含传递给函..
分类:其他好文   时间:2015-05-27 19:18:13    阅读次数:182
HBase shell的基本用法
hbase提供了一个shell的终端给用户交互。使用命令hbaseshell进入命令界面。通过执行help可以看到命令的帮助信息。以网上的一个学生成绩表的例子来演示hbase的用法。namegradcoursemathartTom59787Jim48980这里grad对于表来说是一个只有它自己的列族,course对于表来说是一个有两..
分类:系统相关   时间:2015-05-27 19:18:12    阅读次数:292
Storm高级原语(二) -- DRPC详解
Storm里面引入DRPC主要是利用storm的实时计算能力来并行化CPU密集型(CPU intensive)的计算任务。DRPC的stormtopology以函数的参数流作为输入,而把这些函数调用的返回值作为topology的输出流。 DRPC其实不能算是storm本身的一个特性, 它是通过组合storm的原语stream、spout、bolt、 topology而成的一种模式(pat...
分类:其他好文   时间:2015-05-27 19:13:47    阅读次数:152
Docker底层存储结构
Docker底层存储结构 由于aufs并未并入内核,故而目前只有Ubuntu系统上能够使用aufs作为docker的存储引擎,而其他系统上使用lvm thin provisioning(overlayfs是一个和aufs类似的union filesystem,未来有可能进入内核,但目前还没有;Lvm snapshot are useful for doing e.g. backup of a ...
分类:其他好文   时间:2015-05-27 19:13:22    阅读次数:397
Hadoop源代码分析(IFile)
Mapper的输出,在发送到Reducer前是存放在本地文件系统的,IFile提供了对Mapper输出的管理。我们已经知道,Mapper的输出是对,IFile以记录的形式存放了这些数据。为了保存键值对的边界,很自然IFile需要保存key-len和value-len。 和IFile相关的类图如下:   其中,文件流形式的输入和输出是由IFIleInputStream和IFIleOut...
分类:其他好文   时间:2015-05-27 19:13:11    阅读次数:188
Scala的泛型
我们在这文章将要学习Scala的最后一个特性是泛型。Java程序员们可能最近才知道这个东西,因为这个特性是在Java1.5中才被加入的。 泛型是一种可以让你使用类型参数的设施。例如当一个程序员正在实现一个链表时,将不得不面对诸如如何决定链表中节点保存数据的类型之类的问题。正由 于这是一个链表,所以往往会在不同的环境中使用,因此,我们不能草率的决定节点数据类型,比如说Int。这种决定是相当的草率且...
分类:其他好文   时间:2015-05-27 19:12:03    阅读次数:261
hive函数----集合统计函数
集合统计函数1. 个数统计函数: count 语法: count(*), count(expr), count(DISTINCT expr[, expr_.]) 返回值: int 说明: count(*)统计检索出的行的个数,包括NULL值的行;count(expr)返回指定字段的非空值的个数;count(DISTINCTexpr[, expr_.])返回指定字段的不同的非空...
分类:其他好文   时间:2015-05-27 19:11:46    阅读次数:527
sqoop内部结构
1.1  Sqoop内部结构 本节介绍Sqoop的内部结构。 Sqoop程序是由的主类com.cloudera.sqoop.Sqoop驱动。有限数量的额外的类在同一个包:SqoopOptions (如前所述),ConnFactory(即熟练操作ManagerFactory实例)。 1.1.1    一般程序流程 一般的程序流程如下: com.cloudera.sqoop.Sqoop是主类...
分类:其他好文   时间:2015-05-27 19:11:28    阅读次数:169
Redis学习手册(持久化)
一、Redis提供了哪些持久化机制: 1). RDB持久化: 该机制是指在指定的时间间隔内将内存中的数据集快照写入磁盘。 2). AOF持久化: 该机制将以日志的形式记录服务器所处理的每一个写操作,在Redis服务器启动之初会读取该文件来重新构建数据库,以保证启动后数据库中的数据是完整的。 3). 无持久化: 我们可以通过配置的方式禁用Redis服务器的持久化功能,这样我们就可以将Re...
分类:其他好文   时间:2015-05-27 19:10:32    阅读次数:152
254条   上一页 1 ... 17 18 19 20 21 ... 26 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!