今天学习了大数据的一些基本的概念。 什么是Hadoop: 大数据主要还是解决海量数据的存储和海量数据的分析计算。 大数据的特点:大量、高效、多样(结构化数据和非结构化数据)、低价值密度。 Hadoop的三大发行版本: Apache、cloundera、hortonworks。 当然现在clounde ...
分类:
其他好文 时间:
2021-07-09 17:52:26
阅读次数:
0
HDFS 概述 HDFS的产生背景和定义 HDFS产生背景 解决海量数据的存储问题 需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS 只是分布式文件管理系统中的一种。 HDFS定义 HDFS(Hadoop Distributed File System),它是一个文件系统,用于 ...
分类:
其他好文 时间:
2021-06-30 17:40:30
阅读次数:
0
1.Mongo与Mysql简单对比 关系型数据库-MySQL 1.在不同的引擎上有不同的存储方式。 2.查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。 3.开源数据库的份额在不断增加,mysql的份额页在持续增长。 4.缺点就是在海量数据处理的时候效率会显著变慢。 非关系型数据库- ...
分类:
数据库 时间:
2021-06-28 17:50:51
阅读次数:
0
简介: 云原生是一种新型技术体系,是云计算未来的发展方向。今天,阿里云李飞飞将和我们分享何为云原生、云原生如何与分布式有机结合,以及云原生技术如何帮助客户迈入数字原生时代。 作者 | 飞刀来源 | 阿里技术公众号 云原生是一种新型技术体系,是云计算未来的发展方向。今天,我来谈谈何为云原生、云原生如何 ...
分类:
数据库 时间:
2021-06-22 18:24:41
阅读次数:
0
1. MongoDB相关概念 1.1 业务应用场景 传统的关系型数据库(如MySQL),在数据操作的“三高”需求以及应对Web2.0的网站需求面前,显得力不从心。 解释:“三高”需求: High performance - 对数据库高并发读写的需求。 Huge Storage - 对海量数据的高效率 ...
分类:
数据库 时间:
2021-06-20 17:35:12
阅读次数:
0
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多 ...
分类:
其他好文 时间:
2021-05-25 18:15:53
阅读次数:
0
公司的项目数据量有限,获取行业线上线下消费数据也困难,没有足够的数据量,如何应用大数据?如何在公司现有情况下接触实际的高并发大数据项目? 就是想实操一下高并发的架构设计或者参与互联网级别项目的开发,但又不想舍弃现在的工作? 中小企业如何想办法破局 大数据本身就特别容易形成技术垄断,让长尾的中小企业无 ...
分类:
其他好文 时间:
2021-05-24 09:54:03
阅读次数:
0
摘要:本文从总体架构、数据分布方式、计算下推、数据强一致等方面进行介绍GaussDB(for openGauss)。 1.前言 随着云计算规模越来越大,企业业务数据量呈指数级增长,传统数据库在海量数据存储与管理方面显得力不从心,面临“存不下,算得慢、算不准”的问题。 面对挑战,华为云数据库深度融合华 ...
分类:
数据库 时间:
2021-04-16 11:39:30
阅读次数:
0
本文已整理致我的 github 地址 https://github.com/allentofight/easy-cs,欢迎大家 star 支持一下 前言 近年来公司业务迅猛发展,数据量爆炸式增长,随之而来的的是海量数据查询等带来的挑战,我们需要数据量在十亿,甚至百亿级别的规模时依然能以秒级甚至毫秒级 ...
分类:
其他好文 时间:
2021-04-05 12:21:59
阅读次数:
0
1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于 ...
分类:
其他好文 时间:
2021-03-02 12:10:47
阅读次数:
0