目录1)基本2)数学函数3)rownum4)分页5)时间处理6)字符函数7)to_number8)聚合函数9)学生选课10)图书馆借阅基本--新建表:create
table table1( id varchar(300) primary key, name varchar(200) not nul...
分类:
数据库 时间:
2014-05-12 16:11:47
阅读次数:
590
转自http://www.cnblogs.com/qixuejia/archive/2010/07/14/1777105.html1.聚合函数(1)AVG函数功能返回组中值的平均值。空值将被忽略语法AVG([
ALL | DISTINCT ] expression)(2)MAX函数功能返回表达式的最...
分类:
数据库 时间:
2014-05-05 23:23:05
阅读次数:
560
[ 类的关系 ]
① Generalization(泛化)
-> { Inheritance(继承),Realization(实现) }
② Association(关联关系) ->
{ Aggregation(聚合关系),Composition(组合关系) }
③ Dependency(依赖关系)
[ 关系详解 ]
① Generalization(泛化)
泛化...
分类:
其他好文 时间:
2014-05-03 16:53:12
阅读次数:
224
本文将介绍Hadoop中的重点MapReduce的入门知识。(1)MapReduce概述MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。MR由两个阶段组成:Map和Reduce,在Hadoop中用户只需要实现map()和reduce()两个函数,即可实现分布式计算,非常简单..
分类:
其他好文 时间:
2014-05-03 01:53:48
阅读次数:
519
本文在上一节的基础上通过一个简单的MR示例对MapReduce的运行流程进行分析。假设有两行数据,分别是helloyou,hellome,我们要统计其中出现的单词以及每个单词出现的次数。所得的结果为hello2you1me1(1)大致运行流畅1.解析成2个<k,v>,分别是<0,helloyou><10,hel..
分类:
其他好文 时间:
2014-05-03 01:51:40
阅读次数:
382
GOF给出的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。它的目的:提供一种方法顺序访问一个聚合对象中各个元素,
而又不需暴露该对象的内部表示。[GOF 《设计模式》]如果大家只看定义的话估计也不太清楚吧,怎么说呢,从简单来讲,大家可以把它理解为...
分类:
其他好文 时间:
2014-05-02 08:51:18
阅读次数:
319
Pig是Apache的一个开源项目,用于简化MapReduce的开发,实质Pig将转化为MapReduce作业,使开发人员更多专注数据而不是执行的本质,是不懂java人员的福利。Pig由以下两部分组成:1、表达数据流的语言,成为PigLatin。2、运行PigLatin程序的执行环境。目前有两种环境:在单个JVM..
分类:
其他好文 时间:
2014-05-02 07:52:55
阅读次数:
591
本文以康哥的博客为基础进行修改和补充,详见:http://kangfoo.github.io/article/2014/01/hadoop1.x-wordcount-fen-xi/hadoop
mapreduce 过程粗略的分为两个阶段: 1.map; 2.redurce(copy, sor...
分类:
其他好文 时间:
2014-05-02 00:06:57
阅读次数:
553
本文主要针对广告检索领域的查询重写应用,根据查询-广告点击二部图,在MapReduce框架上实现SimRank++算法,关于SimRank++算法的背景和原理请参看前一篇文章《基于MapReduce的SimRank++算法研究与实现》。
SimRank++的矩阵形式的计算公式为:
算法主要步骤如下:
Step1: 计算权值矩阵,并获取最大Query编号和最大广告编号;
Step2:...
分类:
其他好文 时间:
2014-05-01 08:21:53
阅读次数:
527
MapReduce--Logistic Regression...
分类:
其他好文 时间:
2014-04-30 22:37:39
阅读次数:
830