1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words(map,flatmap) 3.全部转换为小写(lower()) 4.去掉长度小于3的单词(filter) 6.练习一的生成单词键值对(map) ...
分类:
其他好文 时间:
2021-03-31 11:48:28
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 ...
分类:
其他好文 时间:
2021-03-31 11:44:46
阅读次数:
0
/* c++ 中 std::sort()使用了快速排序的算法,下面看下它的实现算法 快速排序的基本思想:通过一趟排序将待排记录分割成独立的两部分,其中一部分记录的数字均比另一部分数字小,则可分别对这两部分进行排序,以达到整个序列有序。 算法描述:https://www.bilibili.com/vi ...
分类:
编程语言 时间:
2021-03-31 11:41:36
阅读次数:
0
啊啊啊~ 目的 1、考虑图像预处理的合理性和结果。能达到什么样的结果,该结果是否满足我的需要,如果多余是否有删除的必要? 2、切割问题,他是怎样实现字符的切割的?字符之间识别的依据和划定该依据的标准是什么? Part 1 % function [d]=main() close all clc % 清 ...
分类:
其他好文 时间:
2021-03-30 13:15:22
阅读次数:
0
今天继续昨天的python基本数据类型详解,按照上一篇博文的格式,接下来讲解列表、元组、字典以及集合。 列表 1.用途按位置存放多个值2.定义在[]内用逗号分割开多个任意类型的元素 # 定义列表 # 列表中可以是整型、浮点型、字符串、列表、字典等 msg = [123] # msg = list(1 ...
分类:
编程语言 时间:
2021-03-30 13:00:23
阅读次数:
0
""" 快速排序 分治法(divide and conquer),三步走 1. Partition:选择一个基准(pivot)分割列表为两个子列表,小于基准和大于基准, 基准数通常选择第一个或最后一个元素 2. 对两个子列表分别快排,调用自身 3. 合并结果,两个子列表和只包含基准数的列表 """ ...
分类:
编程语言 时间:
2021-03-29 12:03:54
阅读次数:
0
Markdown学习 标题 ###三级标题 字体 Hello,world! Hello,world! Hello,world! Hello,world! 引用 走向人生巅峰 分割线 图片 ![截图](C:\Users\24135\Pictures\Saved Pictures\头像.jpg) 超链接 ...
分类:
其他好文 时间:
2021-03-17 14:59:46
阅读次数:
0
Markdown学习 标题格式: #空格+标题名字 按回车 二级标题: ##空格+标题名字 按回车 三级标题: ###空格+标题名字 按回车(最多为六级标题) 字体: hello,wold!(加粗) hello,wold!(斜体) hello,wold!(斜体加粗) hello,wold!(两边加两 ...
分类:
其他好文 时间:
2021-03-17 14:52:39
阅读次数:
0
假如分割符文件为 11 22 33 44 55 66 只获取33,66数据,代码如下,核心利用fgets读取到回车终止 #include <sys/types.h> #include <stdio.h> #include <stdbool.h> #define MAX_LEN 1024 bool R ...
分类:
系统相关 时间:
2021-03-16 14:05:13
阅读次数:
0
运行环境 代码执行 Python解释器并不将Python编译成机器码运行,而是由Python虚拟机逐条解释,这也是Python为什么被称之为解释行语言,但是Python虚拟机并不会直接执行.py文件,其是由Python虚拟机执行解释之后的字节码 虚拟机运行过程简介 首先创建Python解释器的主线程 ...
分类:
编程语言 时间:
2021-03-16 13:38:41
阅读次数:
0