1:下载地址 http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/ 2:上传压缩包 scp sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz root@hadoop2:/opt/software 3:解压并重命名 tar - ...
分类:
其他好文 时间:
2021-04-21 12:09:16
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines lines = sc.textFile('file:///home/hadoop/word.txt') 2.将一行一行的文本分割成单词 words flatmap() words=lines.flatMap(lambda line:line.sp ...
分类:
其他好文 时间:
2021-04-20 15:02:06
阅读次数:
0
Docker Hadoop 配置常见错误及解决办法 问题1:wordcount运行卡住,hadoop 任务运行到running job就卡住了 INFO mapreduce.Job: Running job: job_.... 解决如下: 1. 修改mapred-site.xml配置,配置文件在Ha ...
分类:
其他好文 时间:
2021-04-20 14:54:20
阅读次数:
0
Redis基础 NoSQL 学名(not only sql) 特点: 存储结构与MySQL这一种关系型数据库完全不同,NoSQL存储的是key-value形式的数据。 NoSQL有很多产品,都有自己的api和语法,以及业务场景。 产品种类: Mongodb Redis Hbase hadoop No ...
分类:
其他好文 时间:
2021-04-19 14:35:28
阅读次数:
0
用到:java.time,java.util两个jar包,系统默认的包 @Test public void ddd(){ LocalDateTime inDate = convertDateToLDT(DateUtils.strToDate("2021-04-13 17:45", DateUtils ...
分类:
编程语言 时间:
2021-04-15 12:50:08
阅读次数:
0
service mysql start 启动MySQL 1、出现报错The server quit without updating PID file... 1.1.可能是/usr/local/mysql/data/rekfan.pid文件没有写的权限 #执行: chown -R mysql:mys ...
分类:
数据库 时间:
2021-04-12 12:16:04
阅读次数:
0
一、概述 SP1231F是一款降压型PWM电路,该控制器可驱动 3.1A 负载电流。 设计允许 SP1231F在 4.5V到32V宽输入电压范围内工作。通过将 EN引脚逻辑电平拉高来实现外部关断功能,并进入待机模式。 SP1231F 可以工作在 CC(恒流输出)或 CV(恒压输出)两种模式,过流保护 ...
分类:
其他好文 时间:
2021-04-08 13:23:39
阅读次数:
0
1.Spark概述 Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。 除了实 ...
分类:
其他好文 时间:
2021-04-06 15:01:09
阅读次数:
0
2.1 序列化概述 1)什么是序列化 序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。 反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据,转换成内存中的对象。 2)为什么要序列化 一般来说,“活的”对象只生存在内存里,关机断电 ...
分类:
其他好文 时间:
2021-04-06 14:52:31
阅读次数:
0
1.1 MapReduce定义 MapReduce 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析 应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop 集群上。 1.2 Ma ...
分类:
其他好文 时间:
2021-04-05 12:32:51
阅读次数:
0