码迷,mamicode.com
首页 >  
搜索关键字:sqoop 大数据 hadoop 数据预处理 sqoop2    ( 25615个结果
Spark 集群安装部署
安装准备 Spark 集群和 Hadoop 类似,也是采用主从架构,Spark 中的主服务器进程就叫 Master(standalone 模式),从服务器进程叫 Worker Spark 集群规划如下: node-01:Master node-02:Worker node-03:Worker 安装步 ...
分类:其他好文   时间:2021-05-24 17:07:05    阅读次数:0
打开hive后,show databases报错HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
启动hive时,show databases; 然后报错: 查看自己的配置文件没有问题(hbase-site.xml中配置的mysql账号信息与mysql账号信息一致),于是乎看别人的解决方法: 第一种解决办法(失败)[1]: 由于没有初始化数据库导致,执行名称初始化数据库,执行命令: schema ...
分类:数据库   时间:2021-05-24 16:48:31    阅读次数:0
人人都在谈的图数据库到底是个啥?
摘要: 图数据库,如果是刚接触的人,可能会被其字面意思所误导。其实,图数据库并不是指存储图片、图像的数据库,而是指存储图这种数据结构的数据库。那么图又是什么呢? 本文分享自华为云社区《图数据库到底是个啥》,原文作者:你好_TT 。 近些年来,在大数据处理过程中有一种被广泛提及和使用的数据库,那就是图 ...
分类:数据库   时间:2021-05-24 15:56:35    阅读次数:0
Flume对接HBASE报错:NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration
方案一:手动拷贝需要的相关jar包 flume对接HBASE报错,找不到相关的类: 报错hbase相关日志: 18 五月 2021 17:25:50,633 ERROR [lifecycleSupervisor-1-2] (org.apache.flume.lifecycle.LifecycleSu ...
分类:Web程序   时间:2021-05-24 15:18:47    阅读次数:0
泛在感知中台建设方案
前言 工业互联网平台普遍面临的问题是: 1、在数据完成采集和展示之后,数据如何分析、如何挖掘、如何建模、如何将数据价值变现? 2、不同行业的技术原理、行业知识、基础工艺都不一样,如何建设跨行业跨领域的工业互联网平台? 泛在感知中台是跨行业跨领域的大数据处理中台,可以帮助企业提升平台能力,为企业提供丰 ...
分类:其他好文   时间:2021-05-24 13:32:33    阅读次数:0
搞懂什么是数据库事务
前言 事务(Transaction)是数据库学习中非常重要的一种概念,作为关系型数据库的核心组成,在数据安全方面有着非常重要的作用。 事务在各大数据库中都有非常广泛的应用,并且对于很多业务,例如电商、支付,是保证其可以正常运行的根基。 本文会逐步解析数据库事务的核心特性,以获得对事务更深的理解,主要 ...
分类:数据库   时间:2021-05-24 10:21:59    阅读次数:0
cube.js预聚合对于大数据量处理的问题
cube.js 的预聚合是一个很不错的功能,但是目前是有一些问题的,比如我们包含了大量的数据(几十完,上百万) 目前官方相关的解决方法 数据拆分 基于文件模式的文件处理(比如cubestore支持csv格式的) 基于stream模式的数据处理(目前官方也比较推荐的模式) 一些说明 目前方案都不太好, ...
分类:Web程序   时间:2021-05-24 09:57:40    阅读次数:0
小企业面对大数据如何破局,高并发与海量数据技术又如何操作?
公司的项目数据量有限,获取行业线上线下消费数据也困难,没有足够的数据量,如何应用大数据?如何在公司现有情况下接触实际的高并发大数据项目? 就是想实操一下高并发的架构设计或者参与互联网级别项目的开发,但又不想舍弃现在的工作? 中小企业如何想办法破局 大数据本身就特别容易形成技术垄断,让长尾的中小企业无 ...
分类:其他好文   时间:2021-05-24 09:54:03    阅读次数:0
(转)Spark与Map-Reduce区别对比
典型架构 很多的场景都是如上的,有web(包括无线、以前CS的模式、现在的BS模式等)、DB、cache、数据分析我就用了Hadoop了(代名词,或者泛指数据仓库了),另外就是一些传感器之类的,数据通道(有的简单如:jdbc等,有的比较复杂,保序不丢等),其中也简单列了一些中间件的软件。这张图组成了 ...
分类:其他好文   时间:2021-05-24 09:02:34    阅读次数:0
从RDD创建DataFrame
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() import pandas as pd import numpy as np arr = np.arange(6).reshape(-1 ...
分类:其他好文   时间:2021-05-24 08:54:40    阅读次数:0
25615条   上一页 1 ... 6 7 8 9 10 ... 2562 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!