码迷,mamicode.com
首页 >  
搜索关键字:大数据 sqoop 数据处理    ( 17411个结果
redis集群扩容
1.集群的数据迁移 在工作中经常会遇到redis集群的扩容的场景,因为当一个集群服务器中的内存不够用无法支撑更大数据量的缓存或者并发量不够(个人理解),就会将原有的集群扩展。集群扩容需要将集群中原有的master节点上的槽位以及数据迁移到新加入的master节点上。 每个槽都把要里面的数据迁移完才能 ...
分类:其他好文   时间:2020-10-09 21:40:42    阅读次数:46
前浪:传统数据中心的网络模型
个推运维平台高级网络工程师山川随着互联网公司规模的扩大,企业对成本控制和数据安全的需求越来越高,大部分公司往往会自建机房,而非租用云服务器。个推在互联网数据中心(InternetDataCenter,简称IDC)网络规划和运营方面也经历了几次的迭代和变迁,同时,我们也对数据中心网络发展的历程进行了总结。我们将围绕IDC网络运营规划的基本要求、传统PC时代的网络架构、移动互联网和大数据时代的IDC网
分类:其他好文   时间:2020-10-09 21:23:35    阅读次数:21
初识Hadoop
大数据是指无法在一定时间范围内用常规软件工具进行处理和分析的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能的海量、高增长率和多样性的信息资产
分类:其他好文   时间:2020-10-08 18:36:53    阅读次数:17
Hadoop基础(五十二):sqoop相关面试题
1、Sqoop参数 /opt/module/sqoop/bin/sqoop import \ --connect \ --username \ --password \ --target-dir \ --delete-target-dir \ --num-mappers \ --fields-ter ...
分类:其他好文   时间:2020-10-06 21:17:18    阅读次数:41
基于Celery + RabbitMQ实现订阅发布模式
Celery+RabbitMQ实现订阅发布模式使用RabbitMQ的扇形交换机(fanoutexchange)实现订阅发布模式消息(Message)由Client发送,RabbitMQ接收到消息之后通过交换机转发到对应的队列上面。Worker会从队列中获取未被读取的数据处理。RabbitMQ消息模式的核心理念是:生产者没有直接发送任何消费到队列。实际上,生产者都不知道这个消费是发送给哪个队列的。相
分类:其他好文   时间:2020-10-05 22:08:39    阅读次数:27
[Aliyun] 实时数仓Hologres Demo01实时计算实时写入数据至Hologres
部分内容直接摘抄阿里官网作为背景和概述:背景在实时数据业务场景中,最常见的链路是将实时采集的数据,通过实时计算初步清洗,实时写入数据至数据库,再对接BI工具实现数据的可视化分析。数据处理流程如下图所示。整个业务链路中,要求数据库提供高性能的计算服务,存储海量数据,同时对接多种BI分析工具。单一的数据库很难实现以上所有功能,您必须借助其他数据库的相关能力完成业务流程。在导入导出数据时会产生冗余存储,
分类:其他好文   时间:2020-10-05 22:00:02    阅读次数:31
大数据学习16_shuffle阶段&求共同好友项目实战
shuffle阶段 概念 shule 是 Mapreduce 的核心,它分布在 Mapreduce 的 map 阶段和 reduce 阶段。一般把从 Map 产生输出开始到 Reduce 取得数据作为输入之前的过程称作 shule。 一张图看懂Mapreduce全过程 概念解释 Collect阶段 ...
分类:其他好文   时间:2020-10-05 21:45:42    阅读次数:32
大数据集群分发同步脚本
集群分发脚本xsync在/usr/local/bin目录下,创建xsync文件[root@yh-hadoop101bin]#pwd/usr/local/bin[root@yh-hadoop101bin]#chmod777xsync[root@yh-hadoop101bin]#lltotal4-rwxr-xr-x1rootroot487Sep2913:58xsync[root@yh-hadoop10
分类:其他好文   时间:2020-10-05 21:32:21    阅读次数:19
matplotlib设置颜色、标记、线条,让你的图像更加丰富
今天是数据处理专题的第11篇文章,我们继续来介绍matplotlib这个包的使用方法。 在上一篇文章当中我们介绍了matplotlib当中subplot的概念以及用法,今天我们将会来介绍matplotlib绘图中的一些具体的设置,可以让我们画出来的图像更加丰富,表现力也更强。 颜色 我们之前绘制的图 ...
分类:其他好文   时间:2020-09-24 21:46:54    阅读次数:55
为什么要在大数据中心实施元数据管理
在数据管理领域,我们一直致力于让数据为我们提供价值,为此我们付出大量的努力和投入。在过去二十年,各大企业都在着手搭建数据仓库。当我们费尽艰辛搭建好数据仓库并成功用于线上运行时,发现我们将花费更多时间为数据科学家、分析师做数据准备。分析他们的数据需求,提供闪闪发光的数据报表。这将占用数据维护人员80%的时间投入,这个投入是偏高的,包含如沟通、反查、校正等大量重复和不必要投入。如何提升数据管理能力?我
分类:其他好文   时间:2020-09-23 23:53:26    阅读次数:38
17411条   上一页 1 ... 31 32 33 34 35 ... 1742 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!