一.引言 Spark SQL支持两种不同的方法将现有RDD转换为数据集。 1.第一种方法使用反射来推断包含特定类型对象的RDD的模式。这种基于反射的方法可以使代码更简洁,并且在编写Spark应用程序时已经了解了模式,因此可以很好地工作。详细资料参考 DataFrame与RDD互操作之反射 在开始之前 ...
分类:
其他好文 时间:
2019-01-25 11:40:06
阅读次数:
189
自然语言处理NLP( natural language process)是这几年越来越火了,kaggle上的比赛有关NLP的也日渐多起来了. NLP的应用场景很多,情感分析,邮件过滤,ai客服,机器翻译等等等等,就像这几年越来越火有成为BAT之后第四极的今日头条,为什么能够为每个人推送不同的感兴趣的 ...
分类:
编程语言 时间:
2018-12-24 17:19:03
阅读次数:
397
一:中断,分上半部分,硬中断,下半部分,软中断。 软中断包括网络收发,定时,调度等。可以查看 /proc/softirps文件查看软中断情况。 每个cpu都有一个软中断内核进程,叫 ksoftirqd/cpu编号。如果软中断频率太高,CPU处理不及时,就会是网络收发延时,调度缓慢。 三个工具比较重要 ...
分类:
其他好文 时间:
2018-12-17 21:06:11
阅读次数:
766
上一篇说了软中断的基本原理,先回看下。 中断是一种异步的事件处理机制,用来提高系统的并发处理能力。中断事件发生,会触发执行中 断处理程序,而中断处理程序被分为上半部和下半部这两个部分。 上半部对应硬中断,用来快速处理中断; 下半部对应软中断,用来异步处理上半部未完成的工作。 Linux 中的软中断包 ...
分类:
其他好文 时间:
2018-12-12 20:37:37
阅读次数:
1052
类似于C语言,批处理也有它的语句结构。批处理的语句结构主要有选择结构(if语句)、循环结构(for语句)等。 if语句(选择结构) if语句实现条件判断,包括字符串比较、存在判断、定义判断等。通过条件判断,if语句即可以实现选择功能。 1、字符串比较 if语句仅能够对两个字符(串)是否相同、先后顺序... ...
分类:
其他好文 时间:
2018-11-06 22:35:31
阅读次数:
203
第一种,判断包含基本类型的数组中的重复元素 第二种,判断包含对象的数组中的重复元素 ...
分类:
编程语言 时间:
2018-10-20 17:27:59
阅读次数:
155
Github项目连接 一、项目简介 该项目是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。 二、项目实现 ...
分类:
编程语言 时间:
2018-09-14 23:18:26
阅读次数:
281
原文地址:https://www.cnblogs.com/zacky31/p/9057193.html 目标: 创建一个最基本的“区块链” 实现一个简单的挖矿系统 前提: 对面向对象编程有一定的基础 注意: 值得注意的是,这不会是一个完整的功能,恰恰相反,这是一个概念证明的实例,可以帮助您进一步了解 ...
分类:
编程语言 时间:
2018-09-05 00:42:30
阅读次数:
232
java开发包(JDK)中包含大量的系统功能包,包中有各种实用类,称为API(Application Programing Interface,应用程序接口)。这些类是根据功能的不同放在不同的包中,所以根据包名就可以判断包主要有哪些功能类,以方便编程时查找和使用。 构建图形用户界面(GUD)的类库、 ...
分类:
其他好文 时间:
2018-08-13 20:54:48
阅读次数:
131
语言 Python 选择Python是因为Python是一门动态脚本型语言,也有人称之为胶水语言,实在是因为Python的应用太广泛了,什么都能做,但想做好还是要看领域。 由于Python是边解释边运行的,所以其速度肯定不如编译型语言如C的。 Python的语法简单,类型不需提前声明,对类的继承/多 ...
分类:
其他好文 时间:
2018-08-05 16:57:20
阅读次数:
150