关键结构 node您在哪里存储数据。它是基本的数据库基础结构组件。cluster一组用于存储数据的分布式节点。集群可以具有单个节点,单个数据中心或多个数据中心。datacenter在群集内为复制目的一起配置的一组相关节点。数据中心可以是物理数据中心或虚拟数据中心。使用单独的数据中心可防止事务受到其他 ...
分类:
其他好文 时间:
2020-01-03 10:30:19
阅读次数:
81
一、统计分析方法论: 1.描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述统计分为集中趋势分析和离中趋势分析和相关分析三大 ...
分类:
其他好文 时间:
2019-09-28 20:27:58
阅读次数:
134
redis分布式部署 - 概念:可以将一组程序执行在多台机器上(分布式机群),使其进行数据的分布爬取。 1.scrapy框架是否可以自己实现分布式? 其一:因为多台机器上部署的scrapy会各自拥有各自的调度器,这样就使得多台机器无法分配start_urls列表中的url。(多台机器无法共享同一个调 ...
分类:
编程语言 时间:
2019-09-28 00:36:22
阅读次数:
108
对比常用统计图 折线图: 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化) 直方图: 特点:绘制连续性的数据,展示一组或者多组数据的分布情况(统计) 条形图: 特点:绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差距(统计) 散点图: 特点:判断变量之间是否存在数量关联趋势,展 ...
分类:
其他好文 时间:
2019-09-26 21:21:37
阅读次数:
97
借助MATLAB(R2017b)分布拟合工具箱distributionFitter,我们可以快速地检查数据的分布。 可以进行非参数密度估计(核平滑方法)和参数密度估计(Beta分布、gamma分布、Normal分布等十几个常用的参数模型)。 给出参数估计结果: Distribution: Gener ...
分类:
其他好文 时间:
2019-09-19 21:27:00
阅读次数:
488
前言 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类 ...
分类:
其他好文 时间:
2019-08-28 17:15:47
阅读次数:
98
HBase ——Shell操作 Q:你觉得HBase是什么? A:一种结构化的分布式数据存储系统,它基于列来存储数据。 基于HBase,可以实现以廉价PC机器集群存储海量数据的分布式数据库的解决方案。 一般用于数据量巨大但查询简单的场景,典型场景包括:账单记录,订单流水,交易记录,数据库的历史记录 ...
分类:
系统相关 时间:
2019-08-28 15:53:19
阅读次数:
123
探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数据进行总结等。 探索性数据分析(EDA)与传统统计分析(Classical Analysis)的区别 ...
分类:
其他好文 时间:
2019-08-24 15:00:37
阅读次数:
156
Hadoop: 适合大数据的分布式存储和计算平台
现为Apache顶级开源项目,Hadoop不是指具体一个框架或者组件,它是Apache软件基金会下用Java语言开发的一个开源分布式计算平台。实现在大量计算机组成的集群中对海量数据进行分布式计算,适合大数据的分布式存储和计算平台。 ...
分类:
其他好文 时间:
2019-08-24 10:08:07
阅读次数:
82
Redis是一个高性能基于key/value存储数据的分布式缓存数据库,基于内存运行并且支持持久化的NoSQL数据库。 根据CAP理论(强一致性、可用性和分区容错性),一个分布式系统不可能同时很好的满足这三个要求,最多只能较好的满足其中两个要求。那么分布式系统中分区容错性是必不可少的,而且结合当下用 ...
分类:
其他好文 时间:
2019-08-19 13:22:20
阅读次数:
79