搜索关键字：rdd spark hive hadoop，搜索到23938个结果！码迷,mamicode.com！

关于hive核心

一、DDL数据定义 1、创建数据库 1）创建一个数据库，数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2）避免要创建的数据库已经存在错误，增加 if not exists ...

分类：其他好文时间：2021-07-26 16:38:58 阅读次数：0

【c#】Dev BarStaticItem问题汇总

1、显示图标添加图标以后，把PaintStyle属性修改为CaptionGlyph2、实现鼠标移到上方显示文本内容（1）静态添加设置SuperTip属性，点击“...”输入标题和要显示的内容（2）动态添加https://www.cnblogs.com/DoNetCShap/archive/2012/ ...

分类：Windows程序时间：2021-07-23 17:44:03 阅读次数：0

特征工程

2.1 数据集目标知道数据集的分为训练集和测试集会使用sklearn的数据集 2.1.1 可用数据集 Kaggle网址：https://www.kaggle.com/datasets UCI数据集网址： http://archive.ics.uci.edu/ml/ scikit-learn网址 ...

分类：其他好文时间：2021-07-19 16:53:01 阅读次数：0

hadoop系列之一问题锦集

1、启动过程中出现Configuration has multiple addresses that match local node's address. Please configure the system with dfs.nameservice.id and dfs.ha.namenode ...

分类：其他好文时间：2021-07-16 17:32:09 阅读次数：0

数据积压

数据积压指的是消费者因为一些外部的IO、一些比较耗时的操作（full GC--stop the world），就会造成消息在partition中一直存在得不到消费，就会产生数据积压。所以需要监控系统（kafka的监控系统Eagle），如果出现这种情况，需要尽快处理，虽然后续的spark strea ...

分类：其他好文时间：2021-07-13 17:40:18 阅读次数：0

MapReduce报错Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio

在使用MapReduce的小测试的时候，Driver类启动，或报下面的错误 log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory). log4j: ...

分类：编程语言时间：2021-07-12 18:06:41 阅读次数：0

假期学习——大数据的初步认识

今天学习了大数据的一些基本的概念。什么是Hadoop：大数据主要还是解决海量数据的存储和海量数据的分析计算。大数据的特点：大量、高效、多样（结构化数据和非结构化数据）、低价值密度。 Hadoop的三大发行版本： Apache、cloundera、hortonworks。当然现在clounde ...

分类：其他好文时间：2021-07-09 17:52:26 阅读次数：0

《机器学习Python实现_10_10_集成学习_xgboost_原理介绍及回归树的简单实现》

一.简介 xgboost在集成学习中占有重要的一席之位，通常在各大竞赛中作为杀器使用，同时它在工业落地上也很方便，目前针对大数据领域也有各种分布式实现版本，比如xgboost4j-spark,xgboost4j-flink等。xgboost的基础也是gbm，即梯度提升模型，它在此基础上做了进一步优化 ...

分类：编程语言时间：2021-07-05 19:03:36 阅读次数：0

[源码解析] 深度学习分布式训练框架 horovod (9) --- 启动 on spark

Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架，在业界得到了广泛应用。本文是系列第九篇，介绍 horovod on spark 如何启动。 ...

分类：其他好文时间：2021-07-05 17:30:40 阅读次数：0

使用Java API之副本系数深度剖析

问题描述：（1）使用Java API创建HDFS文件并写入内容的副本系数为3 （2）使用命令上传至HDFS中的文件副本数为1：举例[hadoop@hadoop000 software]$ hadoop fs -put jdk-8u91-linux-x64.tar.gz / 问题回答：（1）使用J ...

分类：编程语言时间：2021-07-05 16:38:12 阅读次数：0

共23938条 1 2 3 4 ... 2394 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)