搜索关键字：数据分区，搜索到123个结果！码迷,mamicode.com！

redis集群

数据分区槽的分配 Redis Cluster采用虚拟槽分区，将所有键使用哈希函数映射到编号为0~16383槽（slot）内，每个节点拥有一部分的槽 → 分布式存储通过以下方式计算key属于哪一个slot： slot = CRC16(key) % 16384 每个节点只需要维护自己被分配的slot ...

分类：其他好文时间：2020-07-28 22:28:46 阅读次数：88

软件的优化（三）数据库的优化（Mysql）

数据库技术的优化,根据优化分类：根据使用的层面分为：数据库语句具体sql层面数据表层面数据库层面一、sql 1、应尽量避免在 where 子句中使用 != 或 <> 操作符，否则将引擎放弃使用索引而进行全表扫描。 2、应尽量避免在 where 子句中使用 or 来连接条件，如果一个字段有索 ...

分类：数据库时间：2020-07-07 16:09:00 阅读次数：105

Redis 集群演进探讨和总结

Redis为什么需要集群？首先Redis单实例主要有单点，容量有限，流量压力上限的问题。 Redis单点故障，可以通过主从复制replication，和自动故障转移sentinel哨兵机制。但Redis单Master实例提供读写服务，仍然有容量和压力问题，因此需要数据分区，构建多个Master实 ...

分类：其他好文时间：2020-06-26 18:08:20 阅读次数：59

spark数据分区数量的原理

原始RDD或数据集中的每一个分区都映射一个或多个数据文件，该映射是在文件的一部分或者整个文件上完成的。 Spark Job RDD/datasets在执行管道中，通过根据分区到数据文件的映射读取数据输入到RDD/dataset。如何根据某些参数确定spark的分区数？影响数据分区数的参数： ( ...

分类：其他好文时间：2020-06-18 13:16:01 阅读次数：66

Spark分区

一、Spark数据分区方式简要在Spark中，RDD（Resilient Distributed Dataset）是其最基本的抽象数据集，其中每个RDD是由若干个Partition组成。在Job运行期间，参与运算的Partition数据分布在多台机器的内存当中。这里可将RDD看成一个非常大的数组， ...

分类：其他好文时间：2020-05-29 20:55:31 阅读次数：55

Redis为什么需要集群？

Redis为什么需要集群？首先Redis单实例主要有单点，容量有限，流量压力上限的问题。 Redis单点故障，可以通过主从复制replication，和自动故障转移sentinel哨兵机制。但Redis单Master实例提供读写服务，仍然有容量和压力问题，因此需要数据分区，构建多个Master实 ...

分类：其他好文时间：2020-05-24 18:07:28 阅读次数：302

小记--------sparkSQL - spark基础知识

1.RDD 是spark的核心数据结构，全称是弹性分布式数据集。本质上是一种分布式的内存抽象，表示一个只读的数据分区集合。一个RDD通常只能通过其他的RDD转换而创建，RDD定义了各种丰富的转换操作，通过转换操作，新的RDD包含了如何从其他RDD衍生所必须的信息。这些信息构成了RDD之间的依赖关系 ...

分类：数据库时间：2020-04-19 01:15:39 阅读次数：108

Kafka-语义&重复消费&丢失数据&分区有序

记录下和kafka相关的语义、不重复消息、不丢失数据、分区有序的内容，文中很多理解参考文末博文、书籍还有某前辈。 kafka语义 kafka中有三种语义，它对理解下面的不重复消费有帮助。最多一次（at most once）：消息最多被处理一次，可能有消息丢失的风险。至少一次（at least o ...

分类：其他好文时间：2020-04-10 22:53:46 阅读次数：144

RDD的三个机制

1.血统机制 RDD只支持粗粒度转换，即只记录单个块上执行的单个操作。将创建RDD的一系列Lineage（即血统）记录下来，以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为，当该RDD的部分分区数据丢失时，它可以根据这些信息来重新运算和恢复丢失的数据分区。 RDD与RDD ...

分类：其他好文时间：2020-04-06 17:52:36 阅读次数：154

Redis Cluster 原理详解，应付面试官就看这一篇！

Redis 缓存作为使用最多的缓存工具被各大厂商争相使用。通常我们会使用单体的 Redis 应用作为缓存服务，为了保证其高可用还会使用主从模式（Master-Slave），又或者是读写分离的设计。但是当缓存数据量增加以后，无法用单体服务器承载缓存服务时，就需要对缓存服务进行扩展。将需要缓存的数据切分成不同的分区，将数据分区放到不同的服务器中，用分布式的缓存来承载高并发的缓存访问。恰好 Redis Cluster 方案刚好支持这部分功能。今天就来一起看看 Redis Cluster 的核心原理和实践： Redis Cluster 实现数据分区分布式缓存节点之间的通讯请求分布式缓存的路由缓存节点的扩展和收缩故障发现和恢复

分类：其他好文时间：2020-04-03 23:37:40 阅读次数：82