1、什么是hive Hive是一个基于Hadoop的数据仓库,可以将结构化数据映射成一张表,并提供类SQL的功能,最初由Facebook提供,使用HQL作为查询接口、HDFS作为存储底层、mapReduce作为执行层,设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据,2008年 ...
分类:
其他好文 时间:
2017-04-24 13:17:44
阅读次数:
202
软件测试V模型V模型大体可以划分为以下几个不同的阶段步骤:需求分析、概要设计、详细设计、软件编码、单元测试、集成测试、系统测试、验收测试。需求分析即首先要明确客户需要的是什么,需要软件做成什么样子,需要有哪几项功能,这一点上比较关键的是分析师和客户沟通时的理..
分类:
其他好文 时间:
2017-04-21 21:55:03
阅读次数:
216
Kylin提供了标准的ODBC和JDBC接口,能够和传统BI工具进行很好的集成。分析师们可以用他们最熟悉的工具来享受Kylin带来的快速。我们也可以对它进行定制开发报表等,把kylin当做数据库服务器就行了。 首先我们来看一下连接Kylin的URL格式为: jdbc:kylin://<hostnam ...
分类:
数据库 时间:
2017-04-17 21:53:54
阅读次数:
3743
数据库连接池技术是指在系统初期或者初次使用时。完毕数据库的连接,以后不再释放此连接,在处理后面的请求时。反复使用这些已经建立的连接。这样的方式能够大大降低数据库的处理时间。有利于提高系统的总体性能、可測量性和扩展性。应用server的快速缓存?在应用server中有页面的缓存和数据库的缓存。页面的缓 ...
分类:
其他好文 时间:
2017-04-17 18:32:42
阅读次数:
210
以下是一位在数据分析领域打滚了N年后,写下的一些体会,一定能给新人一些借鉴的地方。(总结的不错,大家可以借鉴学习哦) 一、数据分析师有哪些要求? 1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。 2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图) ...
分类:
其他好文 时间:
2017-04-07 20:36:44
阅读次数:
237
转自:一个电商数据分析师的经验总结 http://www.woshipm.com/operate/36334.html 3、 聚类分析 零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主 要有两种K-mea ...
分类:
其他好文 时间:
2017-04-06 12:20:33
阅读次数:
202
上海2月21-24日Cloudera Developer training for Spark and Hadoop(CCA-175)北京2月23-26日Cloudera Developer training for Spark and Hadoop(CCA-175)上海2月27-3月2日Cloud ...
分类:
其他好文 时间:
2017-03-04 12:34:35
阅读次数:
211
迭代解析练习主要考察了 空字典的创建和parse 的相关命令操作 字典的创建 1.直接创建 2.序列对创建 3.fromkeys()方法创建 python文档中给出的更多实例 练习:迭代解析 答案 ...
分类:
其他好文 时间:
2017-02-12 01:14:40
阅读次数:
222
引言:普通数据分析师与高级数据分析师的差异有一个非常重要的点,那就是数据思维。数据思维与数据敏感度有一些类似,都是类似于情商类的看不见摸不着的东西。简单来说数据思维是一种通过数据手段解决问题的思维。本文选自《从1开始——数据分析师成长之路》。大家还记得中学时..
分类:
其他好文 时间:
2017-02-10 18:52:26
阅读次数:
180