HBase 虽然可以存储数亿或数十亿行数据,但是对于数据分析来说,不太友好,只提供了简单的基于 Key 值的快速查询能力,没法进行大量的条件查询。现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等。今天主要说Hive,Hive方便地提供了Hiv ...
分类:
其他好文 时间:
2021-01-21 10:54:30
阅读次数:
0
数仓分层 虽然作为数据分析或者商业分析师并不需要去做数据仓库,但在企业实际工作中,或多或少,还是需要接触或对接数仓部门,如提出需求、了解相关表的字段含义等,所以今天我们就简单说下数据分析师需要了解的 数据仓库基础知识。 ODS层 / 贴源层 DW层(Data Warehouse) 数据明细层:DWD ...
分类:
其他好文 时间:
2021-01-13 11:15:23
阅读次数:
0
背景 近期在处理fMRI数据,在此记录一些常用数据处理软件、工具及说明文件,便于随时查找。 1、Rest plus 包括数据处理的pipeline,以及各种绘图功能。安装方法:直接下载安装包并解压到当前文件夹,移动至MATLAB的toolbox文件夹,并设置路径,在命令行输入“restplus”即可 ...
分类:
其他好文 时间:
2021-01-11 11:18:33
阅读次数:
0
Python 是面向对象、解释型的编程语言优点:简洁、易学、几乎全能、支持面向对象 Python能做什么?数据分析与挖掘、黑客逆向编程、网络爬虫、机器学习、开发WEB项目、开发游戏、自动化运维 Python的安装官网下载:https://www.python.org/downloads/window ...
分类:
编程语言 时间:
2021-01-07 11:57:31
阅读次数:
0
NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 数据分析三剑客:Numpy,Pandas,Matplotlib 一、创建ndarray 1.使用np.array()创建 一维数组创建 im ...
分类:
其他好文 时间:
2021-01-07 11:53:57
阅读次数:
0
推荐使用vika维格表来进行员工管理。 vika维格表是一款智能灵活多变的管理软件,它能够从组织人事、员工信息、数据分析、花名册、假勤管理、薪酬管理的各个方面解决了企业人力资源管理的问题。 为什么区区一个表格样式的工具,能够在这么多方面满足我们对人力资源管理的问题呢? 首先,我们看一下这张维格表:智 ...
分类:
其他好文 时间:
2021-01-06 12:45:57
阅读次数:
0
一个重要的闭环: 机器学习-数据挖掘的流程(CRISP-DM):围绕数据进行如下6个活动进行闭环式地探索活动 商业理解 数据理解 数据准备 建立模型 模型评估 方案实施 一个重要的概念: 特征工程:最大限度地从原始数据中提取特征以供算法和模型使用,包括如下几个主要部分: 数据预处理:标准化、缩放、缺 ...
分类:
其他好文 时间:
2021-01-06 11:47:45
阅读次数:
0
网站用户行为分析 步骤 1.1 本地数据集上传到数据仓库Hive 数据集下载与查看 数据集预处理 把数据集导入HDFS中 在Hive上创建数据库 1.2 Hive数据分析 给出数据分析需求 用select语句实现数据分析 数据分析结果查看与保存 1.3 Hive、MySQL、HBase数据互导 操作 ...
分类:
Web程序 时间:
2021-01-02 11:41:47
阅读次数:
0
WEKA的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以参考weka的接
分类:
其他好文 时间:
2021-01-02 11:36:56
阅读次数:
0
【导读】在给大家分享基础入门知识的同时,我们也会带领大家去阅读一些相关领域的书籍。以做阅读理解的态度为大家剖析书中知识点,相信你如果能够跟上我们的节奏一起学习,一定会有所收获。今天给大家分享的这本书是机械工业出版社出版的《数据挖掘概念与技术》(作者:Jiawei Han;Micheline Kamb ...
分类:
其他好文 时间:
2021-01-02 10:47:04
阅读次数:
0