大数据阶段的重要课程划分 HDFSAPI HDFS创建目录 HDFS删除目录 HDFS修改文件名 获得文件详细信息 hadoop环境变量 通过IO流操作HDFS 字符流和字节流 字节流: 字节流什么都能读 , 字节, 图片 , 音乐, 视频, 文件 字符流: 只能读取文本 字节流直接操作的是文件的本 ...
分类:
其他好文 时间:
2018-11-17 20:56:07
阅读次数:
180
◇学时·10 & 模板·3◇ AC自动机 跟着高中上课……讲AC自动机的扩展运用。然而连KMP、trie字典树都不怎么会用的我一脸懵逼<(_ _)> 花一上午自学了一下AC自动机 QwQ ? Trie树 字典树的一种(听说还有其他字典树,不清楚)。每个节点代表一个字母,根节点相当于超级源点,根节点不 ...
分类:
其他好文 时间:
2018-10-22 14:59:37
阅读次数:
176
主要思路:文件读入文章,用HashMap 来存放出现的单词的次数,Key 是要统计的单词,Value 是单词出现的次数。最后再按照 Key 的升序排列出来。 { HashMap: 数组:采用一段连续的存储单元来存储数据。对于指定下标的查找,时间复杂度为O(1);通过给定值进行查找,需要遍历数组,逐一 ...
分类:
其他好文 时间:
2018-10-12 01:26:50
阅读次数:
193
package 统计1; import java.util.Scanner; import java.io.*; import java.util.regex.Matcher; import java.util.regex.Pattern; public class UserNeedManager ...
分类:
其他好文 时间:
2018-10-12 01:23:31
阅读次数:
179
最高气温 1、上传温度数据文件到HDFS 2、求最高、最低、平均温度 方式一,无reduceByKey 方式二,有reduceByKey wordcount 1、上传文本文件到HDFS 2、单词统计 ...
分类:
其他好文 时间:
2018-10-09 21:38:36
阅读次数:
147
https://gitee.com/HuppertWu/WordCount 利用c语言实现文本文档的字符、单词、段落统计 思路:通过C的文件流接收字符串,然后通过各个统计字符的函数处理,再将统计结果输出至文件。 相关函数: 字符统计函数: 单词统计函数: 行统计: 主要流程: 测试文本文件: ...
分类:
编程语言 时间:
2018-09-23 22:24:42
阅读次数:
222
基本功能分析 把基本功能在分为几个子功能,他们分别是 把基本功能在分为几个子功能,他们分别是 类图设计 类图设计 设计 算法设计 算法设计 1. 字符统计 2. 单词统计 3.统计行数 逻辑差不多,与上面类似 代码编写 核心代码 考虑到扩展性,利用反射机制和钩子方法实现子类对父类功能的复用和扩展。 ...
分类:
其他好文 时间:
2018-09-23 18:24:42
阅读次数:
225
项目地址:https://gitee.com/loyal888/WordCount 一.工具篇 1.1 IDEA+gitee+git 方便push和增加开发效率,自从用了idea,不可能用eclipse,这辈子都不可能了! Let's do it! 1.1.1 安装idea gitee插件 http ...
分类:
编程语言 时间:
2018-09-23 13:41:07
阅读次数:
176
1. 创建一个类,实现统计文本文件中各类字符和字符串的个数的功能,要求实现: a) 按字符统计,输出各个字符的数量 b) 按单词统计,输出各个单词的数量 2. 在b)的基础上实现一个类keywordIdentifier,读入一个Java程序源文件,输出各个关键字的个数(注释中出现的关键字不计入关键字 ...
分类:
编程语言 时间:
2018-08-25 11:41:29
阅读次数:
199