搜索关键字：大数据 sqoop 数据处理，搜索到17411个结果！码迷,mamicode.com！

Druid简单介绍

什么是druid druid是一个为OLAP查询需求而设计的开源大数据系统，druid提供低延时的数据插入，实时的数据查询 druid使用Java开发，基于Jetty提供http rest服务，也提供了Java/Python等语言的工具包 druid是一个集群系统，使用zookeeper做节点管理和 ...

分类：其他好文时间：2021-01-08 10:28:10 阅读次数：0

大数据组件

Atlas 作用：记录并展示Hive表字段含义，以及表和字段之间的数据血缘关系。局限：依赖HBase和solr。 Azkaban 作用：实现任务流执行，满足任务间依赖关系。局限：任务能添加依赖的任务，但是不能传参数，任务流中任意一条路线断了，不能这条路线重启执行。 ...

分类：其他好文时间：2021-01-07 12:23:38 阅读次数：0

Impala和Hive的关系

1.为什么安装Impala一定要先安装Hive？ Impala是基于Hive的大数据实时分析查询引擎，直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系？ Impala 与Hive都是构建在Hadoop之上的 ...

分类：其他好文时间：2021-01-06 11:58:32 阅读次数：0

第四周学习总结

所学时间（包括上课） 9个小时代码量（行） 1300 博客量 1篇了解到的知识点 centos虚拟机的安装以及大数据相应所用的软件安装以及环境的配置 ...

分类：其他好文时间：2021-01-02 11:40:57 阅读次数：0

池化的名字由何而来？

根据前面的卷积过程，我们可以达到特征提取的作用。基本上已经判断出谁是C谁是D。底下可以再进一步做一次池化。数据库连接池记得吧？把很多数据库连接放在一个池子里，想用时挑一个来用。这里做完卷积得到这么多数据，就像池子一样，对于这池子里的数据，我们可以继续做各种各样的操作，比如最大池化或平均池化。最大池化 ...

分类：其他好文时间：2021-01-02 11:29:48 阅读次数：0

kafka

Kafka概述定义 Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。传统消息队列的应用场景使用消息队列的好处 1:解耦允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。 2:可恢复性系统的一部分组件失效时 ...

分类：其他好文时间：2021-01-02 10:52:13 阅读次数：0

Stata极简生存分析

1. 导入数据 webuse drugtr,clear *webuse -- Use dataset from Stata website stset,clear *上一行命令导入进来的数据是“生存时间数据”，会比最原始的数据多四列，这一行命令的目的是重置为原始数据，之所以这样做，是为了显示数据处理 ...

分类：其他好文时间：2021-01-01 12:40:36 阅读次数：0

超长解析：一文带你分析与解决分布式系统互斥性与幂等性问题

随着互联网信息技术的飞速发展，数据量不断增大，业务逻辑也日趋复杂，对系统的高并发访问、海量数据处理的场景也越来越多。如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。为了解决这一系列问题，系统架构也在不断演进。传统的集中式系统已经逐渐无法满足要求，分布式系统被使用在更多的场景中。 ...

分类：其他好文时间：2021-01-01 11:52:59 阅读次数：0

【web】架构

1、页面 2、BLL用于逻辑数据处理,即是对数据库返回的数据进行特殊处理返回至webform 3、DAL连接好数据库每一个表,将所需要的值返回,操作的调用存储过程 ...

分类：Web程序时间：2020-12-30 11:26:53 阅读次数：0

kudu计算公式

kudu计算公式：假设:tabletserver32台master5台最大数据存储量为，复制和压缩后，每个tabletserver9.6TB。每个tabletserver管理的tablet为3000，包含tablet的副本。基于以上限制，可以推测出一下内容：分区=每行大小*总条数<=3.2Gtablet（限制每一台tablet-server1500个分区）,目前现在总kudu表为1546张表

分类：其他好文时间：2020-12-30 10:41:55 阅读次数：0

共17411条上一页 1 ... 17 18 19 20 21 ... 1742 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)