搜索关键字：spark 大数据 hadoop hive parquet，搜索到33788个结果！码迷,mamicode.com！

Hadoop 数据迁移用法详解

数据迁移使用场景冷热集群数据分类存储,详见上述描述. 集群数据整体搬迁.当公司的业务迅速的发展,导致当前的服务器数量资源出现临时紧张的时候,为了更高效的利用资源,会将原A机房数据整体迁移到B机房的,原因可能是B机房机器多,而且B机房本身开销较A机房成本低些等. 数据的准实时同步.数据的准实时同步与 ...

分类：其他好文时间：2021-06-10 18:05:50 阅读次数：0

[数据仓库]分层概念,ODS,DM,DWD,DWS,DIM的概念

转自：https://blog.csdn.net/pmdream/article/details/113601956 一. 各种名词解释 1.1 ODS是什么？ ODS层最好理解，基本上就是数据从源表拉过来，进行etl，比如mysql 映射到hive，那么到了hive里面就是ods层。 ODS 全称 ...

分类：其他好文时间：2021-06-10 17:32:45 阅读次数：0

PDO操作大数据对象

一般在数据库中，我们保存的都只是 int 、 varchar 类型的数据，一是因为现代的关系型数据库对于这些内容会有很多的优化，二是大部分的索引也无法施加在内容过多的字段上，比如说 text 类型的字段就很不适合创建索引。所以，我们在使用数据库时，很少会向数据库中存储很大的内容字段。但是，MySQL ...

分类：其他好文时间：2021-06-09 10:39:11 阅读次数：0

小鼎量化机器人系统开发_小鼎量化交易机器人软件APP搭建

小鼎量化机器人系统开发什么是量化交易机器人？量化通过绑定你的交易所API权限，代替人工分析行情和策略，自动做单，解放你的双手和时间，你不需要做什么，只需要定期提走利润即可。 AI赋能24小时交易，机器人可以探测市场买入卖出大数据，融入各项技术指标，自动切入合理的买入卖出点位，并制订最优化的止盈止 ...

分类：移动开发时间：2021-06-08 23:38:26 阅读次数：0

Windows10 从零搭建 Hadoop/Hive 环境及 Hive 入门

1. Hadoop 概览Google 三篇论文（GFS -> HDFS，Map-Reduce -> MR，BigTable -> HBase）是 Hadoop 的思想之源。Hadoop 生态非常庞大，其最初两大核心是 HDFS 和 MR，分别负责存储和计算（Hadoop 1.x 中，MR 既负责计算 ...

分类：Windows程序时间：2021-06-08 23:15:13 阅读次数：0

真正了解sqoop的一切

一．sqoop的简单概论 1.sqoop产生的原因： A. 多数使用hadoop技术的处理大数据业务的企业，有大量的数据存储在关系型数据中。 B. 由于没有工具支持，对hadoop和关系型数据库之间数据传输是一个很困难的事。依据以上的原因sqoop产生的。 2. sqoop的介绍 sqoop是连接 ...

分类：其他好文时间：2021-06-08 22:45:15 阅读次数：0

想要读懂大数据，你不得不先掌握这些核心技术

说起大数据，很多人都能聊上一会，但要是问大数据核心技术有哪些，估计很多人就说不上一二来了。从机器学习到数据可视化，大数据发展至今已经拥有了一套相当成熟的技术树，不同的技术层面有着不同的技术架构，而且每年还会涌现出新的技术名词。面对如此庞杂的技术架构，很多第一次接触大数据的小白几乎都是望而生畏的。 ...

分类：其他好文时间：2021-06-08 22:37:38 阅读次数：0

利用sqoop将hive数据导入导出数据到mysql

运行环境 centos 5.6 hadoop hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具在使用过程中可能遇到的问题： sqoop依赖zookeeper，所以必须配置ZOOKEEPER_HOME到环境变量中。sq ...

分类：数据库时间：2021-06-07 20:36:05 阅读次数：0

09 spark连接mysql数据库

1. 安装启动检查Mysql服务。##netstat -tunlp (3306) cd /usr/local/hive/lib ls mysql* cp mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars/ cd /usr/local/ ...

分类：数据库时间：2021-06-07 20:10:49 阅读次数：0

01 Spark架构与运行流程

1. 阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系，为什么要引入Yarn和Spark。 HDFS是Hadoop体系中数据存储管理的基础，它是一个高度容错的系统，能检测和应对硬件故障，在低成本的通用硬件上运行。 HBase构建在HDFS之上 ...

分类：其他好文时间：2021-06-07 20:05:58 阅读次数：0

共33788条上一页 1 ... 6 7 8 9 10 ... 3379 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)