码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop hive parquet    ( 33788个结果
关于hive核心
一、DDL数据定义 1、创建数据库 1)创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2)避免要创建的数据库已经存在错误,增加 if not exists ...
分类:其他好文   时间:2021-07-26 16:38:58    阅读次数:0
【c#】Dev BarStaticItem问题汇总
1、显示图标添加图标以后,把PaintStyle属性修改为CaptionGlyph2、实现鼠标移到上方显示文本内容(1)静态添加设置SuperTip属性,点击“...”输入标题和要显示的内容(2)动态添加https://www.cnblogs.com/DoNetCShap/archive/2012/ ...
分类:Windows程序   时间:2021-07-23 17:44:03    阅读次数:0
特征工程
2.1 数据集 目标 知道数据集的分为训练集和测试集 会使用sklearn的数据集 2.1.1 可用数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-learn网址 ...
分类:其他好文   时间:2021-07-19 16:53:01    阅读次数:0
hadoop系列之一问题锦集
1、启动过程中出现Configuration has multiple addresses that match local node's address. Please configure the system with dfs.nameservice.id and dfs.ha.namenode ...
分类:其他好文   时间:2021-07-16 17:32:09    阅读次数:0
数据积压
数据积压指的是消费者因为一些外部的IO、一些比较耗时的操作(full GC--stop the world),就会造成消息在partition中一直存在得不到消费,就会产生数据积压。 所以需要监控系统(kafka的监控系统Eagle),如果出现这种情况,需要尽快处理,虽然后续的spark strea ...
分类:其他好文   时间:2021-07-13 17:40:18    阅读次数:0
MapReduce报错Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio
在使用MapReduce的小测试的时候,Driver类启动,或报下面的错误 log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory). log4j: ...
分类:编程语言   时间:2021-07-12 18:06:41    阅读次数:0
假期学习——大数据的初步认识
今天学习了大数据的一些基本的概念。 什么是Hadoop: 大数据主要还是解决海量数据的存储和海量数据的分析计算。 大数据的特点:大量、高效、多样(结构化数据和非结构化数据)、低价值密度。 Hadoop的三大发行版本: Apache、cloundera、hortonworks。 当然现在clounde ...
分类:其他好文   时间:2021-07-09 17:52:26    阅读次数:0
《机器学习Python实现_10_10_集成学习_xgboost_原理介绍及回归树的简单实现》
一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgboost4j-flink等。xgboost的基础也是gbm,即梯度提升模型,它在此基础上做了进一步优化 ...
分类:编程语言   时间:2021-07-05 19:03:36    阅读次数:0
IPFS分布式存储全面运用落地之后,FIL币的价值才达到最巅峰。
IPFS分布式存储全面运用落地之后,FIL币的价值才达到最巅峰。恐怕每个人都明白了一个道理,顺势而为,即做事要顺势,不能逆势而行,这样才更容易成功。现实的法则,生存的法则是这样的。?如今,区块链、数字经济也是如此,抓住“机会”,就能被时代潮流推到成功的彼岸,而这一机遇也是 IPFS作为整个区块链唯一 ...
分类:其他好文   时间:2021-07-05 18:21:09    阅读次数:0
[源码解析] 深度学习分布式训练框架 horovod (9) --- 启动 on spark
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第九篇,介绍 horovod on spark 如何启动。 ...
分类:其他好文   时间:2021-07-05 17:30:40    阅读次数:0
33788条   1 2 3 4 ... 3379 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!