数据分析工作每天要面对各种各样的数据,每种数据都有其特定的含义、使用范围和分析方法,同一个数据在不同环境下的意义也不一样,因此我们想要选择正确的分析方法,得出正确的结论,首先要明确分析目的,并准确理解当前的数据类型及含义。统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如身高、性别等。每个...
分类:
其他好文 时间:
2015-07-26 12:27:55
阅读次数:
147
原文:http://www.itongji.cn/article/0Q926052013.html在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数...
分类:
其他好文 时间:
2015-07-25 16:37:45
阅读次数:
245
TECPLOT.CHORUS.2015.R2.WIN.LINUX.X64 CFD模拟分析Tecplot Chorus为工程师分析大量模拟数据提供了一个崭新的工具。Tecplot Chorus集成了元数据分析、后处理和模拟数据管理功能,方便于加快工程决策的制定。在CFD研究中,Tecplot Chor...
某物流集团企业其中业务包括物流、航运、仓储、贸易、投资、冷链等。下面我们先来看业务构架图: 数据中心 信息平台整合架构设计 IT基础服务建设参考标准 ITIL IT信息安全建设参考标准 ISO270001 硬件网络拓扑结构 业务数据中心和备份方案 统一业务应用 统一数据信息集成规划方案 统一数据分析...
分类:
其他好文 时间:
2015-07-25 15:00:55
阅读次数:
249
Apache Drill初探 介绍 Apache Drill是一个开源的,对于Hadoop和NoSQL低延迟的SQL查询引擎。Apache Drill 实现了Google's Dremel.那么什么是Google's Dremel?网络中一段描述:Dremel 是Google 的"交互式"数据分析系...
分类:
Web程序 时间:
2015-07-25 00:11:12
阅读次数:
1143
一个标题党,在第一个点一个很大的标题来吸引各位看官来。其实原理很easy,我们的工作就是做一些数据的处理,最后生成kml剧本是现在Google Earth上。进入专题:首先数据源http://www.caida.org.这是一个英特网数据分析的合作组织,数据比較权威,全球非常多网络方面的科研数据都来...
分类:
其他好文 时间:
2015-07-23 19:21:52
阅读次数:
110
在所有和数据相关的工作中,主要接触三类表:(一)报表:主要用于呈现数据结果,属于数据可视化的一部分,其中的数据信息可用于自动计算,由于主要用于结果的展示,因此并不适用于统计分析。(二)数据表:列表、水平表、交叉表等,主要用于存放原始数据,因此是统计分析的直接数据源。(三)索引表:和数据表的区别是有关...
分类:
其他好文 时间:
2015-07-23 17:17:49
阅读次数:
124
1.平均数:是描述一组数据集中趋势的指标,有很多种平均数,如:算数平均数,几何平均数,调和平均数,加权平均数,平方平均数,指数平均数等。最常用的是算数平均数平均数非常容易受到极值的影响,因此在数据处理中,要注意对极值的处理2.绝对数:很多书中的定义是某现象在特定时间和范围内的总体情况,是求和计算,虽...
分类:
其他好文 时间:
2015-07-23 17:14:12
阅读次数:
84
数据归一化和两种常用的归一化方法数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综...
分类:
其他好文 时间:
2015-07-22 22:20:33
阅读次数:
213
很多朋友问时下如火如荼的 Hadoop 是否适合引进我们自己的项目,什么时候用 SQL,什么时候用 Hadoop,它们之间如何取舍?Apache Accumulo 用一张图来回答你这个问题,对于不同的数据场景,如何选取正确的数据存储处理工具进行了详细描述。Apache Accumulo 是美国大数据分析及架构专家,Koverse CTO 及联合创始人。...
分类:
数据库 时间:
2015-07-22 18:55:23
阅读次数:
234