码迷,mamicode.com
首页 >  
搜索关键字:数据的分布    ( 203个结果
Cassandra 组件
关键结构 node您在哪里存储数据。它是基本的数据库基础结构组件。cluster一组用于存储数据的分布式节点。集群可以具有单个节点,单个数据中心或多个数据中心。datacenter在群集内为复制目的一起配置的一组相关节点。数据中心可以是物理数据中心或虚拟数据中心。使用单独的数据中心可防止事务受到其他 ...
分类:其他好文   时间:2020-01-03 10:30:19    阅读次数:81
数据分析的方法
一、统计分析方法论: 1.描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述统计分为集中趋势分析和离中趋势分析和相关分析三大 ...
分类:其他好文   时间:2019-09-28 20:27:58    阅读次数:134
python网络爬虫——分布式爬虫
redis分布式部署 - 概念:可以将一组程序执行在多台机器上(分布式机群),使其进行数据的分布爬取。 1.scrapy框架是否可以自己实现分布式? 其一:因为多台机器上部署的scrapy会各自拥有各自的调度器,这样就使得多台机器无法分配start_urls列表中的url。(多台机器无法共享同一个调 ...
分类:编程语言   时间:2019-09-28 00:36:22    阅读次数:108
Matplotlib散点图、条形图、直方图-02
对比常用统计图 折线图: 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化) 直方图: 特点:绘制连续性的数据,展示一组或者多组数据的分布情况(统计) 条形图: 特点:绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差距(统计) 散点图: 特点:判断变量之间是否存在数量关联趋势,展 ...
分类:其他好文   时间:2019-09-26 21:21:37    阅读次数:97
MATLAB分布拟合工具箱distributionFitter
借助MATLAB(R2017b)分布拟合工具箱distributionFitter,我们可以快速地检查数据的分布。 可以进行非参数密度估计(核平滑方法)和参数密度估计(Beta分布、gamma分布、Normal分布等十几个常用的参数模型)。 给出参数估计结果: Distribution: Gener ...
分类:其他好文   时间:2019-09-19 21:27:00    阅读次数:488
了解Hbase的工作原理
前言 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类 ...
分类:其他好文   时间:2019-08-28 17:15:47    阅读次数:98
HBase ——Shell操作
HBase ——Shell操作 Q:你觉得HBase是什么? A:一种结构化的分布式数据存储系统,它基于列来存储数据。 基于HBase,可以实现以廉价PC机器集群存储海量数据的分布式数据库的解决方案。 一般用于数据量巨大但查询简单的场景,典型场景包括:账单记录,订单流水,交易记录,数据库的历史记录 ...
分类:系统相关   时间:2019-08-28 15:53:19    阅读次数:123
探索性数据分析(Exploratory Data Analysis,EDA)
探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数据进行总结等。 探索性数据分析(EDA)与传统统计分析(Classical Analysis)的区别 ...
分类:其他好文   时间:2019-08-24 15:00:37    阅读次数:156
Hadoop开篇
Hadoop: 适合大数据的分布式存储和计算平台 现为Apache顶级开源项目,Hadoop不是指具体一个框架或者组件,它是Apache软件基金会下用Java语言开发的一个开源分布式计算平台。实现在大量计算机组成的集群中对海量数据进行分布式计算,适合大数据的分布式存储和计算平台。 ...
分类:其他好文   时间:2019-08-24 10:08:07    阅读次数:82
Redis
Redis是一个高性能基于key/value存储数据的分布式缓存数据库,基于内存运行并且支持持久化的NoSQL数据库。 根据CAP理论(强一致性、可用性和分区容错性),一个分布式系统不可能同时很好的满足这三个要求,最多只能较好的满足其中两个要求。那么分布式系统中分区容错性是必不可少的,而且结合当下用 ...
分类:其他好文   时间:2019-08-19 13:22:20    阅读次数:79
203条   上一页 1 2 3 4 5 ... 21 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!