一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...
分类:
其他好文 时间:
2020-12-10 10:59:18
阅读次数:
4
void dfs(int** image, int imageSize, int colsize, int r, int c, int newColor, int initColor){ if(r<0 || r>=imageSize || c<0 || c>=colsize || image[r][ ...
分类:
其他好文 时间:
2020-12-02 12:24:45
阅读次数:
6
基环树 基环树直径 P3248 #include<bits/stdc++.h> using namespace std; #define ll long long const int N=1e5+5; int n; int te,v[N<<1],pre[N<<1],tail[N]; ll L,len ...
分类:
其他好文 时间:
2020-12-01 12:29:19
阅读次数:
7
1、深度优先搜索dfs 在搜索树上的表现形式为先序遍历。 2、广度优先搜索bfs 在搜索树上的表现形式为层序遍历。 3、记忆化搜索 在某些位置需要被多次计算时,记录第一次计算的答案,后续可以省去重复计算的复杂度。 4、剪枝 搜索的瓶颈毫无疑问在于时间,合理的剪枝可以提高时效,有时候甚至可以牺牲一些正 ...
分类:
其他好文 时间:
2020-11-25 12:19:56
阅读次数:
4
###链接 我好菜啊。。。 考虑每条边对答案的贡献为多少。 显然可以定义状态 \(f_{i,j}\) 表示 \(i\) 子树中有 \(j\) 个黑点,子树中每条边对答案贡献之和的最大值。 于是合并就是背包,方程为 \(f_{u,i+j}=f_{u,i}+f_{v,j}+((k-j)*j+((n-k) ...
分类:
其他好文 时间:
2020-11-16 13:35:00
阅读次数:
7
题目链接 127. 单词接龙 题目描述 解题思路 题目中有个关键词:最短转换序列的长度,我们知道常见的搜索算法有两种:DFS和BFS,那么本题适用哪种算法呢?两种都适用吗? 记住题目中如果出现最短关键字一定要采用BFS搜索算法去解决,而不是采用和我一样采用DFS(一开始死磕DFS,搞了一下午还是没有 ...
分类:
其他好文 时间:
2020-11-13 13:14:15
阅读次数:
19
经典dfs将当前位置传入,标记和当前点一类的点,同时进行计数 class Solution { public int[] pondSizes(int[][] land) { List<Integer> res = new LinkedList<>(); int m = land.length,n = ...
分类:
其他好文 时间:
2020-11-13 13:11:37
阅读次数:
9
class Solution { private TreeNode res = null; public boolean dfs(TreeNode root,TreeNode p,TreeNode q){ if(root==null){ return false; } boolean lchild ...
分类:
其他好文 时间:
2020-11-11 16:27:40
阅读次数:
8
###P2915 [USACO08NOV]Mixed Up Cows G dfs去做 #include<iostream> #include<cstdio> #include<cmath> #include<cstring> #define ll long long using namespace ...
分类:
其他好文 时间:
2020-11-11 15:59:42
阅读次数:
7
#!/bin/sh use=`df|grep "/dev/vdb1"|awk '{print $5}'| sed 's/%//g'` if [[ $use -gt 80 ]];then hdfs dfs -rm -r -skipTrash /user/admin/.flink fi; 先编写好she ...
分类:
系统相关 时间:
2020-11-08 16:52:29
阅读次数:
30