1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 HDFS是Hadoop体系中数据存储管理的基础,它是一个高度容错的系统,能检测和应对硬件故障,在低成本的通用硬件上运行。 HBase构建在HDFS之上 ...
分类:
其他好文 时间:
2021-03-16 13:21:18
阅读次数:
0
目前流行几种备份方式:逻辑备份、物理备份、双机热备份、备份脚本的编写等,本文分别从这些方面总结了MySQL自动备份策略的经验和技巧,一起来看看。 目前流行几种备份方式: 一、逻辑备份:使用mysql自带的mysqldump工具进行备份。备份成sql文件形式。 优点:最大好处是能够与正在运行的mysq ...
分类:
数据库 时间:
2021-03-16 11:56:10
阅读次数:
0
数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺诈,ABtest等等 OLAP(On-Line Analytical Processing):在线分析处理,主要用于支持企业决策管理分析。 ...
分类:
其他好文 时间:
2021-03-16 11:54:33
阅读次数:
0
增添数据到数据库 package com.jdbc; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet; im ...
分类:
编程语言 时间:
2021-03-16 11:40:11
阅读次数:
0
1. 为什么要引入Yarn和Spark。 从开源角度看,YARN的提出,从一定程度上弱化了多计算框架的优劣之争。YARN是在Hadoop MapReduce基础上演化而来的,在MapReduce时代,很多人批评MapReduce不适合迭代计算和流失计算,于是出现了Spark和Storm等计算框架,而 ...
分类:
其他好文 时间:
2021-03-15 11:29:44
阅读次数:
0
新增了五个教程: Python 和 Jupyter 机器学习入门 零、前言 一、Jupyter 基础知识 二、数据清理和高级机器学习 三、Web 爬取和交互式可视化 Python 数据科学和机器学习实践指南 零、前言 一、入门 二、统计和概率回顾和 Python 实践 三、Matplotlib 和高 ...
分类:
Web程序 时间:
2021-03-15 11:11:19
阅读次数:
0
本节目录 一 锁的分类及特性 二 表级锁定(MyISAM举例) 三 行级锁定 四 查看死锁、解除锁 五 事务 六 慢日志、执行计划、sql优化 七 OLTP与OLAP的介绍和对比 八 关于autocommit的测试 一 锁的分类及特性 数据库锁定机制简单来说,就是数据库为了保证数据的一致性,而使各种 ...
分类:
数据库 时间:
2021-03-15 10:47:31
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTable,即分布式NoSQL列数据库,外加Zo ...
分类:
其他好文 时间:
2021-03-15 10:45:14
阅读次数:
0
材料: 阿贝云(www.abeiyun.com) 百度开放平台(http://developer.baidu.com/console#app/project) 百度账号 操作 阿贝云官网部分 访问www.abeiyun.com,点击右上角注册输入相关信息注册 进入控制台,点击财务->充值,充1块钱用 ...
分类:
Web程序 时间:
2021-03-15 10:40:14
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 答: Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTabl ...
分类:
其他好文 时间:
2021-03-15 10:30:53
阅读次数:
0