码迷,mamicode.com
首页 >  
搜索关键字:sqoop 大数据 hadoop 数据预处理 sqoop2    ( 25615个结果
如何入门数据分析?详解完整学习路径(1)
作者介绍@大师兄混迹数据江湖十余载。主要负责大数据商业变现和产品运营工作。好多想要入门数据分析师这个岗位的同学,不知道该如何规划自己的学习路径,我尝试把数据分析师的入门路径总结7个阶段,供大家参考。第一阶段:会用Excel做简单的数据统计分析第二阶段:会用SQL从数据库提取数据第三阶段:能够玩转商业智能BI工具第四阶段:掌握数理统计知识,擅长高级统计分析第五阶段:擅长通过编程玩转数据分析第六阶段:
分类:其他好文   时间:2020-09-09 19:00:04    阅读次数:40
Python为什么这么热门?学习Python有什么好处?
Python是一门非常熟悉的编程语言,面对这个大数据的时代,数据已经成为了生活之中非常重要的一部分。之前有人说过Java语言是适合数据分析的计算机编程语言之一,在这里,我想要告诉大家,其实对于Java来说,Python更适合大数据领域,也是最受欢迎的编程语言。
分类:编程语言   时间:2020-09-09 18:44:25    阅读次数:85
redis五大数据类型——String
redis五大数据类型——String Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持多种类型的数据结构,如字符串(strings), 散列(hashes), 列表(lists), 集合(sets), 有序集合(sorted sets) ...
分类:其他好文   时间:2020-09-09 18:40:08    阅读次数:32
阿里云体验实验室 教你如何《搭建Hadoop环境》
体验平台简介面向开发者和中小企业打造的一站式、全云端的开发平台,打开浏览器就可以开发、调试、上线,所测即所得,并结合无服务器的模式,重新定义云原生时代的研发工作方法论。旨在降低开发者上手成本和中小企业的启动成本、运营成本、以及突发流量带来的运维风险。教程介绍本教程介绍如何在Linux实例上快速搭建一个Hadoop伪分布式环境。场景体验场景内容选自阿里云体验实验室阿里云体验实验室提供一台配置了Cen
分类:其他好文   时间:2020-09-08 21:06:59    阅读次数:61
大数据学习07_HDFS1
HDFS概述 HDFS(Hadoop Distributed File System)是 Apache Hadoop 项目的一个子项目. Hadoop 非常 适于存储大型数据 (比如 TB 和 PB), 其就是使用 HDFS 作为存储系统. HDFS 使用多台计算机存 储文件, 并且提供统一的访问接 ...
分类:其他好文   时间:2020-09-08 20:40:45    阅读次数:34
Hadoop3.2.1伪分布式和分布式详细搭建
一.环境介绍1.centos7.6vmware虚拟机主节点190.168.3.250slave190.168.3.251slave190.168.3.2522.每个节点配置好hosts解析3.下载好软件https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.htmlhadoop-3.
分类:其他好文   时间:2020-09-07 19:16:59    阅读次数:68
大数据实战(六十八):电商数仓(五十二)Cloudera Manager(三)CM部署准备
1 连接阿里云服务器 打开远程连接工具进行配置,这里以CRT为例。 1)新建一个session 2)填写hostname(填写公网ip) 2 修改hosts文件 [root@hadoop001 ~]# vim /etc/hosts 127.0.0.1 localhost localhost ::1 ...
分类:其他好文   时间:2020-09-07 18:57:02    阅读次数:43
数字城市与智慧城市的创建,数字化大数据技术的应用
城市即是“资源高地”,又存在着“效率洼地”。经过几千年的发展,人口高度集中进一步加重了城市公共资源网的供求矛盾,为城市治理者产生日渐严峻的诸多挑战。咱们的城市“得病”了,交通堵塞、空气污染、治安违法等难题备受群众抨击。为处理城市发展难点,完成城市可持续性发展,建设智慧城市已变成当今社会城市发展不可避免的历史潮流。近二十年来,智慧城市建设耗费巨资,却没有根除“城市病”。那智慧城市自身究竟是什么呢?智
分类:其他好文   时间:2020-09-04 17:24:04    阅读次数:50
运营商大数据怎么获取精准数据
大数据并非只是是数据量大,(公众号:大海啊好多水)不是数据数量多的运用便是大数据,需求的是悉数,更需求的是跨界融合。假设仅是将某一方面的数据加以拾掇和分析,这么的所谓“大数据”只是计算报表的一种碰瓷算了。在大数据的展开中,包括运营商在内的运用者都应当致力于前进数据的跨度、融合度以及概括运用才华。运营商大数据有什么用处运营商大数据可以获取指定网站,app,400电话,固话访客的数据。比如:你是做装修
分类:其他好文   时间:2020-09-04 17:00:49    阅读次数:56
技本功|Hive优化之配置参数的优化(一)
Hive是大数据领域常用的组件之一,主要用于大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive调优是必不可少的一项技能。影响Hive效率的主要因素有数据倾斜、数据冗余、job的IO以及不同底层引擎配置情况和Hive本身参数和HiveSQL的执行等。本文主要从建表配置参数方面对Hive优化进行讲解
分类:其他好文   时间:2020-09-04 16:58:58    阅读次数:42
25615条   上一页 1 ... 49 50 51 52 53 ... 2562 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!