前言 Kafka 是一款分布式消息发布和订阅系统,具有高性能、高吞吐量的特点而被广泛应用与大数据传输场景。它是由 LinkedIn 公司开发,使用 Scala 语言编写,之后成为 Apache 基金会的一个顶级项目。kafka 提供了类似 JMS 的特性,但是在设计和实现上是完全不同的,而且他也不是 ...
分类:
编程语言 时间:
2021-01-19 11:48:43
阅读次数:
0
有序集合有两种编码方式:压缩列表 ziplist 和跳表 skiplist。 ...
分类:
其他好文 时间:
2021-01-16 12:09:10
阅读次数:
0
热身30题 1.描述一下HDFS的写流程 2.描述一下HDFS的读流程 3.详细讲解一下HDFS的体系结构 4.如果一个datanode出现宕机,恢复流程是什么样的? 5.通常你是如何解决Haddop的NameNode宕机的,流程是什么? 6.描述一下NameNode对元数据的管理 7.NameNo ...
分类:
其他好文 时间:
2021-01-14 10:47:06
阅读次数:
0
原文链接:https://blog.csdn.net/qq_26803795/article/details/106522611 文章目录 一、前言 二、内置分词器解析 2.1、内置分词器梳理 2.2、内置分词器对中文的局限性 三、安装IK分词器 3.1、下载IK分词器 3.2、编译源码包 3.3、 ...
分类:
其他好文 时间:
2021-01-12 10:47:41
阅读次数:
0
背景 近期在处理fMRI数据,在此记录一些常用数据处理软件、工具及说明文件,便于随时查找。 1、Rest plus 包括数据处理的pipeline,以及各种绘图功能。安装方法:直接下载安装包并解压到当前文件夹,移动至MATLAB的toolbox文件夹,并设置路径,在命令行输入“restplus”即可 ...
分类:
其他好文 时间:
2021-01-11 11:18:33
阅读次数:
0
public static IFeatureClass FeatureToFeature(IFeatureClass SourFeature,IFeatureClass TargetFeature, List<ColumnInternationMapping> columnMapp,bool IsO ...
分类:
其他好文 时间:
2021-01-11 11:06:09
阅读次数:
0
为了满足竞争日益激烈的多元化市场需求,工艺设计周期短、任务重,同时对工艺设计质量及投产周期提出了更高的要求。 ...
分类:
其他好文 时间:
2021-01-11 10:30:41
阅读次数:
0
一个案例 import matplotlib.pyplot as plt # 数据处理 data = [ ['01/01','0','0'], ['01/02','1','0'], ['01/03','4','13'], ['01/04','14','30'], ['01/05','20','43' ...
分类:
编程语言 时间:
2021-01-08 11:48:33
阅读次数:
0
#1、form-data: 就是http请求中的multipart/form-data,它会将表单的数据处理为一条消息,以标签为单元,用分隔符分开。 既可以上传键值对,也可以上传文件。 当上传的字段是文件时,会有Content-Type来说明文件类型; content-disposition,用来说 ...
分类:
Web程序 时间:
2021-01-08 10:55:07
阅读次数:
0
引言 Apache Spark 2.2 以及以上版本提供的三种 API - RDD、DataFrame 和 Dataset,它们都可以实现很多相同的数据处理,它们之间的性能差异如何,在什么情况下该选用哪一种呢? RDD 从一开始 RDD 就是 Spark 提供的面向用户的主要 API。从根本上来说, ...
分类:
数据库 时间:
2021-01-08 10:40:55
阅读次数:
0