尚硅谷大数据技术之HBase (作者:尚硅谷大数据研发部) 版本:V1.2 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hb ...
分类:
其他好文 时间:
2020-07-27 16:06:52
阅读次数:
97
版权声明:本文为CSDN博主「九品下」的原创文章 原文链接:https://blog.csdn.net/w892824196/article/ HBase能提供实时计算服务主要原因是由其架构和底层的数据结构决定的,即由LSM-Tree(Log-Structured Merge-Tree) + HTa ...
分类:
其他好文 时间:
2020-07-26 19:15:06
阅读次数:
69
数据准备1 数据导入、导出 读取Excel(.xlrx文件)并进行导出备份 import pandas as pd from pandas import DataFrame # Pandas可以直接从xlsx(excel)、csv等文件中导入数据,也可以输出到xlsx(excel)、csv格式中 s ...
分类:
其他好文 时间:
2020-07-26 19:00:03
阅读次数:
59
典型的主从架构。其中 RegionServers 负责与客户端的交互,访问数据 HMaster 负责 Region 分配,DDL(create, delete tables) 操作。 1. Regions hbase table 根据 RowKey 划分成多个 Region,Region 包含所划分 ...
分类:
其他好文 时间:
2020-07-26 15:21:40
阅读次数:
62
数据分析基本流程 Python基本数据类型 Python各种括号的使用方式 数据分析基本流程 数据采集 数据挖掘 理解业务需求,对挖掘目标进行定义 理解数据:进行数据描述,数据质量验证 数据准备:收集数据(数据导入与导出)、数据清洗、数据集成 建模:选择和应用各种数据挖掘类型 数据可视化 报表工具 ...
分类:
编程语言 时间:
2020-07-26 15:04:48
阅读次数:
64
1. 简要介绍 HBase 是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的 BigTable 建模,实现的编程语言为 Java。它是 Apache 软件基金会的 Hadoop 项目的一部分,运行于 HDFS 文件系统之上,为 Hadoop 提供类似于 BigTable 规模的服务,可 ...
分类:
其他好文 时间:
2020-07-26 01:59:15
阅读次数:
89
题记: 因业务需要,需将一些用户记录进行汇总并上传到指定平台。需要先将指定时间的所有用户记录进行汇总。涉及到了大数据量的数据导入导出。 使用 iINTO OUTFILE 和 LOAD DATA LOCAL INFILE 实现了改功能,记录一下 步骤: 1 将源数据导出(select * from t ...
分类:
数据库 时间:
2020-07-25 23:53:48
阅读次数:
72
NoSQL 有分很多种,其中key-value NoSQL (Redis, MemcacheD, etc) 的选用相对比较清楚些,大多是当后端Data storage的cache层来用。这篇主要想请教Column Family NoSQL (e.g. Cassandra, Hbase) 和SQL之间 ...
分类:
数据库 时间:
2020-07-24 15:31:56
阅读次数:
77
数据库: 本质上就是一个文件系统,通过标准的sql语句对数据进行增删改查(curd)操作 数据库类型: 关系型数据库: 存放实体与实体间关系的数据库,本质上为二维表(mysql、oracle、sql server、DB2) 非关系型数据库: 存放的是对象(redis、No-sql、Hbase、Mon ...
分类:
数据库 时间:
2020-07-24 09:27:08
阅读次数:
94
数据 ROW COLUMN+CELL 1001 column=info:name, timestamp=1502368030841, value=张三 1001 column=info:age, timestamp=1502368069926, value=18 1001 column=info:s ...
分类:
Web程序 时间:
2020-07-23 01:46:26
阅读次数:
108