什么是MongoDB ? MongoDB 是一个开源的文档数据库,它基于 C++ 语言编写,性能高,可用性强,能够自动扩展。 MongoDB 是最流行的 NoSQL 数据库之一,原生支持分布式集群架构,特别适合处理大数据,阿里巴巴、腾讯、头条、Twitter、Google、Facebook 等一线互 ...
分类:
数据库 时间:
2020-09-17 19:21:55
阅读次数:
41
概述 定义 HDFS是一个分布式文件管理系统 优缺点 优点 (1)高容错 多副本提高容错、某个副本丢失可以自动恢复 (2)适合处理大数据 ? 能处理PB级别数据、能处理百万的文件数据量 (3)可构建在廉价机器上 缺点 (1)不适合低时延数据访问 (2)无法高效存储小文件 (3)不支持并发写入和文件修 ...
分类:
其他好文 时间:
2020-06-14 20:26:42
阅读次数:
58
1.简述人工智能、机器学习和深度学习三者的联系与区别。 联系:深度学习使得机器学习能够实现众多应用,并拓展了人工智能的领域范畴。 区别:人工智能是目的,是结果;深度学习、机器学习是方法,是工具;深度学习则是一种实现机器学习的技术;它适合处理大数据。 2. 全连接神经网络与卷积神经网络的联系与区别。 ...
分类:
其他好文 时间:
2020-06-02 09:46:53
阅读次数:
51
一、HDFS优缺点 优点: 高容错性 数据自动保存多个副本 某一个副本丢失后,它可以自动恢复 适合处理大数据 数据规模,可以达到PB级 文件规模,能够处理百万规模的文件数量 可构建在廉价机器上,通过多副本保证可靠性 缺点: 不适合低延时数据访问 不适合对大量小文件进行存储 存储大量小文件,他会占用N ...
分类:
其他好文 时间:
2020-06-01 23:45:55
阅读次数:
68
1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是目的,是结果。 深度学习、机器学习是方法、是工具。 机器学习,一种实现人工智能的方法;机器学习都可以精准地被定义为:1任务T;2.训练过程E;3.模型表现P。 深度学习则是一种实现机器学习的技术;它适合处理大数据。 深度学习使得机器学 ...
分类:
其他好文 时间:
2020-06-01 11:45:00
阅读次数:
61
HDFS的定义? Hadoop分布式文件管理系统。旨在对不同系统上的文件进行统一的管理。它是一个文件系统,用于存储文件,通过目录树来定位文件,其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。 使用场景? 适合一次写入,多次读出的场景,且不支持文件的修改,适合用来做数据 ...
分类:
其他好文 时间:
2020-03-10 11:56:30
阅读次数:
66
概念 海量数据的数据统计平台,将hql翻译为mapreduce程序。 优点 简单;适用于对实时性要求不严的场合;适合处理大数据 缺点 无法表达迭代式计算; 不擅长数据挖掘; 效率比较低。 本质(相当于hadoop的一个客户端) hive的数据存储在hdfs; hive的数据处理在mapreduce; ...
分类:
其他好文 时间:
2019-07-13 21:29:55
阅读次数:
138
90年代初为什么没有“蹦极” 从高处一跃而下的happy,这事情不可能发生在90年代的娱乐花费中,除了自己是在想不开。为什么?因为不顺应时代发展需要,有很多地方温饱都还没有解决。那个年代什么顺应时代了呢,海尔冰箱、美的、格力 格兰仕等等,所以他们发展到了今天! 顺应很重要,其实就是“选择” 你知道吗 ...
分类:
编程语言 时间:
2018-06-14 14:52:34
阅读次数:
177
Sed Sed:是一款流编辑工具,用来对文本进行过滤与替换工作,特别是当你想对几十个配置文件进行统一修改时,你会体会到它的魅力;Sed通过一次仅读取一行内容来对某 些指令进行处理后输出,所以Sed更适合处理大数据文件;Sed通过文件或管道读取文件内容,但它默认并不直接修改源文件,而是将读入的内容复制 ...
分类:
其他好文 时间:
2017-09-27 16:09:38
阅读次数:
187
一.排序算法分类 1.插入排序法 直接插入排序,希尔排序(面试最常问) 2.交换排序 冒泡排序,快速排序(面试最常问) 3.选择排序 直接选择排序,堆排序(面试最常问) 4.归并排序 归并排序 5.基数排序 以上算是最常用的一些算法。 二.空间、时间复杂度、稳定性 三.性能分析 1.O(n^2)性能 ...
分类:
编程语言 时间:
2017-09-21 21:17:16
阅读次数:
226