1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: article/11325 ...
分类:
数据库 时间:
2019-11-14 00:02:19
阅读次数:
222
题目要求: 1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: article ...
分类:
其他好文 时间:
2019-11-13 23:53:43
阅读次数:
176
虚拟机: hadoop:3.2.0 hive:3.1.2 win10: eclipse 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: articl ...
分类:
数据库 时间:
2019-11-13 22:25:39
阅读次数:
162
题目背景 浙江省的几所OI强校的神犇发明了一种人工智能,可以AC任何题目,所以他们决定建立一个网络来共享这个软件。但是由于他们脑力劳动过多导致全身无力身体被♂掏♂空,他们来找你帮助他们。 题目描述 共有n所学校(n include include include include include de ...
分类:
Web程序 时间:
2019-11-13 21:52:57
阅读次数:
100
192.168.31.250 - - [13/Nov/2019:08:38:07 +0800] "GET /aa HTTP/1.1" 404 571 "-" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l ...
分类:
其他好文 时间:
2019-11-13 11:07:41
阅读次数:
74
奶牛抗议 DP 树状数组 ~~USACO的题太猛了~~ 容易想到$DP$,设$f[i]$表示为在第$i$位时方案数,转移方程: $$ f[i]=\sum f[j]\;(j include using namespace std; define MAXN 100010 define lowbit(x) ...
分类:
编程语言 时间:
2019-11-12 20:34:55
阅读次数:
103
Nov 4,2019 ~ Nov 10,2019 Algorithm 本周主要的算法是如何求两个数的最大公因数。传统的想法便是对这两个数分解质因数,而后找到其公共因数,再相乘,这样就会得到最大公因数了。话不多说,直接看代码吧。 但是,显然可以看出,先求解因数,再求解公共因数集合,最后相乘得到结果。这 ...
分类:
其他好文 时间:
2019-11-11 00:13:27
阅读次数:
98
虚拟机的内存如何选?主机虚拟机<2G1G>2G2G>8G2G>16G2G
分类:
其他好文 时间:
2019-11-10 09:37:25
阅读次数:
66
栈模拟,哈希 #include<iostream> #include<cstdio> #define ri register int #define u unsigned long long namespace opt { inline u in() { u x(0),f(1); char s(ge ...
分类:
其他好文 时间:
2019-11-09 22:01:18
阅读次数:
72
MA308: Statistical Calculation and SoftwareAssignment 2 (Oct 9– Nov 6, 2019)2.1 For the “galton” dataset from Using R package,(a) What will be the con ...
分类:
其他好文 时间:
2019-11-08 19:16:57
阅读次数:
93