ElasticSearch为开源分布式的,基于Restful API,支持PB甚至更高数量级的搜素引擎工具。 Elasticsearch是一个实时分布式搜索和分析引擎。它让你以前所未有的速度处理大数据成为可能。 它用于全文搜索、结构化搜索、分析以及将这三者混合使用 <!--5f39ae17-8c62 ...
分类:
其他好文 时间:
2019-08-13 00:49:30
阅读次数:
134
【KMP】OKR-Periods of Words 题目描述 串是有限个小写字符的序列,特别的,一个空序列也可以是一个串。一个串P是串A的前缀,当且仅当存在串B,使得A=PB。如果P≠A并且P不是一个空串,那么我们说P是A的一个proper前缀。定义Q是A的周期,当且仅当Q是A的一个proper前缀 ...
分类:
其他好文 时间:
2019-08-11 00:20:17
阅读次数:
143
什么是 Elasticsearch ? Elasticsearch (ES) 是一个基于 Lucene 构建的开源、分布式、RESTful 接口全文搜索引擎。还是一个分布式文档数据库,其中每个字段均是被索引的数据且可被搜索,它能够扩展至数以百计的服务器存储以及处理PB级的数据。它可以在很短的时间内在 ...
分类:
其他好文 时间:
2019-08-09 21:58:02
阅读次数:
97
在c# 中编写com组件,供PB调用实例 前言:c#中写的dll直接是不能被pb调用的,只有写成com组件才可以调用,所以用c#写dll时要注意。 c#中新建类库 类库类型为通用类库,项目名为AddCom 1、配置:右键点击解决方案资源管理器中的AddCom,选择“属性”,选择“应用程序”->“程序 ...
一 为什么要学习HIVE? 为什么不是ORACLE和MYSQL? 因为大数据时代 数据量成几何倍数增长,并且数据量非常庞大。大到要用PB EB这种量级去衡量。而我们的ORACLE/MYQL这种数据库是TB级数据库,所以远远的达不到大数据时代对数据的要求。 还有由于大数据工程师主要来自两个方向: 第一 ...
分类:
其他好文 时间:
2019-07-25 17:42:21
阅读次数:
100
大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的各类技术。本文整理出了大数据平台常见的一些开源工具,并且依据其主要功能进行分类,以便大数据学习者及应用
分类:
其他好文 时间:
2019-07-25 12:17:08
阅读次数:
106
## Why Scala在数据集不是很大的时候,开发人员可以使用python、R、MATLAB等语言在单机上处理数据集。但是在大数据时代,数据集少说都是TB、PB级别,此时便需要分布式地处理。相较于上述语言,Scala有着现成的框架即Spark能分布式地处理问题,Scala中有着丰富的Spark A... ...
分类:
其他好文 时间:
2019-07-20 09:21:24
阅读次数:
84
用mmdnn实现模型转换 参考链接:https://www.twblogs.net/a/5ca4cadbbd9eee5b1a0713af 会生成resnet50.json(可视化文件) resnet50.npy(权重参数) resnet50.pb(网络结构)三个文件。 生成tf_resnet50.p ...
分类:
Web程序 时间:
2019-07-04 19:08:52
阅读次数:
696
大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的各 ...
分类:
其他好文 时间:
2019-07-02 13:26:42
阅读次数:
126
毕业生的序列游戏 题目描述 对于三个给定的正整数k, PA, PB, 现在有一个序列构造算法: 在初始条件下,有一个空序列,之后每次你会在该序列的末尾添加一个字母'a'或'b',添加'a'的概率是PA/(PA+PB),添加'b'的概率是PB/(PA+PB)。当在该序列中有至少k个子序列为'ab'的时 ...
分类:
其他好文 时间:
2019-06-30 20:46:25
阅读次数:
142