Hive、Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点。前面已经讨论了Hive和Impala,本节先介绍一下SparkSQL,然后从功能、架构、使用场景几个角度比较这三款产品的异同,最后附上分别由cloudera公司和SAS公司出示的关 ...
分类:
数据库 时间:
2020-06-25 21:29:31
阅读次数:
581
package com.hadoop.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import ...
分类:
Web程序 时间:
2020-06-25 17:58:43
阅读次数:
54
package com.hadoop.hdfs;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import jav ...
分类:
其他好文 时间:
2020-06-25 17:46:58
阅读次数:
39
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:sc ...
分类:
其他好文 时间:
2020-06-25 17:32:46
阅读次数:
65
package com.hadoop.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import ...
分类:
其他好文 时间:
2020-06-25 17:29:21
阅读次数:
73
package com.hadoop.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import ...
分类:
其他好文 时间:
2020-06-25 17:23:59
阅读次数:
69
package com.hadoop.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import ...
分类:
其他好文 时间:
2020-06-25 17:19:12
阅读次数:
66
应用程序慢如牛,原因多多,可能是网络的原因、可能是系统架构的原因,还有可能是数据库的原因。
那么如何提高数据库SQL语句执行速度呢?有人会说性能调优是数据库管理员(DBA)的事,然而性能调优跟程序员们也有莫大的关系。
分类:
其他好文 时间:
2020-06-25 09:29:13
阅读次数:
89
前期准备 可以正常联网 jar包准备 hadoop-xxx-src.tar.gz jdk-xxx-xxx-tar.gz apache-ant-xxx-bin.tar.gz apache-maven-xxx-bin.tar.gz protobuf-xxx.tar.gz jar包安装 jdk安装到mod ...
分类:
其他好文 时间:
2020-06-24 19:23:59
阅读次数:
52
批量执行检查脚本: #!/bin/bash file_name="$1" if [ -z "$file_name" ];then echo "Pls input file path" exit 1 fi cat "$file_name"| while read line do hadoop fsck ...
分类:
其他好文 时间:
2020-06-24 17:58:36
阅读次数:
56