数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺诈,ABtest等等 OLAP(On-Line Analytical Processing):在线分析处理,主要用于支持企业决策管理分析。 ...
分类:
其他好文 时间:
2021-03-16 11:54:33
阅读次数:
0
1. 为什么要引入Yarn和Spark。 从开源角度看,YARN的提出,从一定程度上弱化了多计算框架的优劣之争。YARN是在Hadoop MapReduce基础上演化而来的,在MapReduce时代,很多人批评MapReduce不适合迭代计算和流失计算,于是出现了Spark和Storm等计算框架,而 ...
分类:
其他好文 时间:
2021-03-15 11:29:44
阅读次数:
0
新增了五个教程: Python 和 Jupyter 机器学习入门 零、前言 一、Jupyter 基础知识 二、数据清理和高级机器学习 三、Web 爬取和交互式可视化 Python 数据科学和机器学习实践指南 零、前言 一、入门 二、统计和概率回顾和 Python 实践 三、Matplotlib 和高 ...
分类:
Web程序 时间:
2021-03-15 11:11:19
阅读次数:
0
rootfs:根文件系统 /boot:系统启动相关的文件,如内核、initrd,以及grub(bootloader) /dev:设备文件 设备文件: 块文件:随机访问,数据块 字符设备:线性访问,按字符为单位 设备号:主设备号(major)和次设备号(minor) /etc:配置文件 /home:管 ...
分类:
系统相关 时间:
2021-03-15 10:49:44
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTable,即分布式NoSQL列数据库,外加Zo ...
分类:
其他好文 时间:
2021-03-15 10:45:14
阅读次数:
0
什么是Elastic Shell Elastic Shell是一套完全用Bash Shell编写的,用于管理Elasticsearch搜索引擎的工具脚本。目前,它提供了针对index和snapshot的基本管理,并提供了针对reindex和Elasticsearch集群升级的辅助自动化。 本质上,E ...
分类:
系统相关 时间:
2021-03-15 10:42:46
阅读次数:
0
1、将函数存储在模块里 def fun1(x): ## 在模块module1.py中定义三个函数 print(x.upper()) def fun2(x): print(x.title()) def fun3(x): print(" ",x) 2、测试能否直接调用函数 >>> fun1("aaa") ...
分类:
编程语言 时间:
2021-03-15 10:39:46
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 答: Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTabl ...
分类:
其他好文 时间:
2021-03-15 10:30:53
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和MapReduce,hadoo ...
分类:
其他好文 时间:
2021-03-15 10:30:41
阅读次数:
0
一、编程语言 1、C和C++ 《C Primer Plus》 《C和指针》 《C专家编程》 《C陷阱与缺陷》 《Essential C++》 《C++ Primer》 2、Java 《Java核心技术·卷 I》 《Java核心技术·卷 II》 《Java编程思想》 《深入理解Java虚拟机》 《实战 ...
分类:
其他好文 时间:
2021-03-15 10:30:29
阅读次数:
0