之前有幸在MOOC学院抽中小象学院hadoop体验课。这是小象学院hadoop2.X概述第八章的笔记主要介绍HBase,一个分布式数据库的应用案例。案例概况:1)时间序列数据库(OpenTSDB)用HBase储存时间序列数据,每时每刻都在解决,数据库为开源2)HBase爬虫调度库垂直搜索爬虫大规模爬...
分类:
其他好文 时间:
2015-08-28 22:51:40
阅读次数:
203
如何快速检索?Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在18和30之间,性别为女性这样的组合查询。倒排索引很多地方都有介绍,但是其比关系型数据库的b-tree索引快在哪里?到底为什么快呢?笼统的来说,b-tre...
分类:
数据库 时间:
2015-08-21 11:04:06
阅读次数:
210
什么是时间序列数据?最简单的定义就是数据格式里包含timestamp字段的数据。比如股票市场的价格,环境中的温度,主机的CPU使用率等。但是又有什么数据是不包含timestamp的呢?几乎所有的数据都可以打上一个timestamp字段。时间序列数据更重要的一个属性是如何去查询它。在查询的时候,对于时...
分类:
数据库 时间:
2015-08-21 10:49:13
阅读次数:
208
这里我们使用和之前完全相同的测试数据,来测试 elasticsearch 存储时间序列的表结构选择问题。 一个点一个doc的表结构 同样我们以最简单的表结构开始。在elasticsearch中,先要创建index,然后index下有mapping...
分类:
其他好文 时间:
2015-08-12 20:00:13
阅读次数:
262
InfluxDB是一个用于存储和分析时间序列数据的开源数据库,这里简单总结一下我在部署和使用过程中遇到的问题。
在其官网的介绍中:https://influxdb.com/docs/v0.9/introduction/installation.html 可知InfluxDB可以在Ubuntu,Debian,RedHat,OS
X等系统上部署,我先试了一下OS X上的部署。在OS X上安装...
分类:
数据库 时间:
2015-08-02 23:23:36
阅读次数:
557
OpenTSDB?概述 OpenTSDB?是一种基于?HBase?编写的分布式、可扩展的时间序列数据库。?OpenTSDB可以用来处理一种通用需求:存储、索引和服务从大规模计算机系统(网络设备、操作系统、应用系统)采集来的参数数...
分类:
数据库 时间:
2015-07-30 15:14:30
阅读次数:
222
介绍
开源监控系统OpenTSDB,用hbase存储所有的时序(无须 采样)来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报警系统里。OpenTSDB可以从大规模的集群(包括集群中的网络设备、操作系统、应用程序)中获取相应的metrics并进行存储、索引以及服务,从而使得这些数据更容易让人理解,如web...
分类:
数据库 时间:
2015-03-03 18:38:34
阅读次数:
226
安装graphite的时候发现,graphite安装分graphite-web,whisper,carbon。graphite-web顾名思义,是graphite的网站部分,使用Django框架,使用cairo来根据需要呈现图形whisper:数据库,用来储存时间序列数据carbon:监听时间序列数...
分类:
其他好文 时间:
2014-12-16 16:59:17
阅读次数:
301
MetricsGraphics.js 是建立在D3的基础上,被用于可视化和布局的时间序列数据进行了优化。它提供以产生一个原则性的,一致的和响应式的方式的图形常见类型的简单方法。该库目前支持折线图,散点图和直方图,以及地毯地块和基本线性回归功能。
分类:
Web程序 时间:
2014-12-05 18:56:08
阅读次数:
314
MetricsGraphics.js 是建立在D3的基础上,被用于可视化和布局的时间序列数据进行了优化。它提供以产生一个原则性的,一致的和响应式的方式的图形常见类型的简单方法。该库目前支持折线图,散点图和直方图,以及地毯地块和基本线性回归功能。
分类:
Web程序 时间:
2014-12-05 15:24:58
阅读次数:
255