项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector...
分类:
其他好文 时间:
2014-07-07 10:43:16
阅读次数:
1186
题意,给你n个 x,y,c,意思就是区间[x,y]被染成C色,但是颜色会被覆盖的,染色操作完成以后 问你每种颜色有多少个 并输出颜色编号id跟个数cnt
经典问题,不过写的有点撮吧,没去看别人的,这个方法应该是最传统的最普通的,常规的开数组记录,也许大神们有更高端的方法
#include
#include
#include
#include
#include
#inc...
分类:
其他好文 时间:
2014-07-03 17:54:49
阅读次数:
162
题目大意:
求出在m个串中出现过大于m/2次的子串。
思路分析:
如果你只是直接跑一次后缀数组,然后二分答案扫描的话。
那么就试一下下面这个数据。
2
abcdabcdefgh
efgh
这个数据应该输出
efgh
问题就在于对于每一个串,都只能参与一次计数,所以在check的时候加一个标记数组是正解。
#include
#include
#inc...
分类:
其他好文 时间:
2014-07-03 15:35:12
阅读次数:
171
上次看到这个有点晕了,其实这个vector保存的是std::vector#include #include using namespace std;int main(){ std::vector > num; std::vector a(10, 5); num.push_back(...
分类:
其他好文 时间:
2014-07-02 20:14:53
阅读次数:
182
C++内置的数组支持容器的机制,但是它不支持容器抽象的语义。要解决此问题我们自己实现这样的类。在标准C++中,用容器向量(vector)实现。容器向量也是一个类模板。标准库vector类型使用需要的头文件:#include 。vector 是一个类模板。不是一种数据类型,vector是一种数据类型。...
分类:
编程语言 时间:
2014-07-02 19:57:22
阅读次数:
256
首先看这两类都实现List接口,而List接口一共有三个实现类,分别是ArrayList、Vector和LinkedList。List用于存放多个元素,能够维护元素的次序,并且允许元素的重复。3个具体实现类的相关区别如下:ArrayList是最常用的List实现类,内部是通过数组实现的,它允许对元素...
分类:
编程语言 时间:
2014-07-02 19:41:51
阅读次数:
217
ArrayListh和Vector都是采用数组的方式来存储数据,其中ArrayList是线程不安全的,Vector是线程安全,所以ArrayList的性能要比Vector的性能好一些,而LinkedList采用的双向链表来实现数据的存储,而且是线程不安全的,而且LinkedList提供了一些方法,使得LinkedList可以被当做..
分类:
其他好文 时间:
2014-07-02 15:40:54
阅读次数:
213
C++中的容器类包括“顺序存储结构”和“关联存储结构”,前者包括vector,list,deque等是线性的;后者包括set,map,multiset,multimap等则能够通过key访问元素,multimap,multiset
允许一个key对应多个元素,这和数学中的映射道理一样,完全映射,多重映射。。。。下面介绍一下map的使用,其他的使用方法类似。
一、map的说明
...
分类:
编程语言 时间:
2014-07-02 15:20:06
阅读次数:
209
#region File Header & Copyright Notice/* * Copyright (C) 2014 XXX, INC. All Rights Reserved. * THIS SOURCE CODE IS CONFIDENTIAL AND PROPRIETARY AND MA...
分类:
其他好文 时间:
2014-07-02 10:07:59
阅读次数:
221
Vector简介
Vector也是基于数组实现的,是一个动态数组,其容量能自动增长。
LinkedList是JDK1.0引入了,它的很多实现方法都加入了同步语句,因此是线程安全的(其实也只是相对安全,有些时候还是要加入同步语句来保证线程的安全),可以用于多线程环境。
LinkedList没有丝线Serializable接口,因此它不支持序列化,实现了Cloneable接口,能被克隆,实现了RandomAccess接口,支持快速随机访问。
Vector源码剖析
Vector的...
分类:
编程语言 时间:
2014-07-02 07:42:51
阅读次数:
349