Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完...
分类:
其他好文 时间:
2015-04-17 18:40:23
阅读次数:
112
给学习SQL的同学的福利@ http://sqlschool.modeanalytics.com/ 第一部分 学习SQL 本教程是专为那些想用数据回答问题的人们而设计的。从很大程度上讲,SQL是数据分析的基础,它可以用来访问、清洗和分析存储在数据库中的数据。SQL是很容易学习的,而且有世界上最大的公...
分类:
数据库 时间:
2015-04-17 17:21:07
阅读次数:
172
IDC评述网(idcps.com)04月17日报道:根据中国互联网络信息中心(CNNIC)最新公布的数据显示,截止至2015年3月,.CN域名总量减至11,678,026个,净减14,403个,与上月对比,降幅缩小81%,颓势明显减缓。接下来,请看详尽数据分析。(图1).CN域名增长趋势图根据图1,在2015年3..
分类:
其他好文 时间:
2015-04-17 11:48:38
阅读次数:
111
IDC评述网(idcps.com)04月16日报道:根据中国互联网络信息中心(CNNIC)公布的最新数据显示,截至2015年3月,“.中国”域名总量持续跌至265,052个,降幅增至4,016个,环比约上涨30%。接下来,请看具体数据分析。(图)“.中国”域名增长趋势图通过上图,IDC评述网获悉,在201..
分类:
其他好文 时间:
2015-04-16 10:28:22
阅读次数:
169
本节将一下逻辑回归和R语言实现,逻辑回归(LR,LogisticRegression)其实属于广义回归模型,根据因变量的类型和服从的分布可以分为,普通多元线性回归模型,和逻辑回归,逻辑回归是指因变量是离散并且取值范围为{0,1}两类,如果离散变量取值是多项即变为 multi-class classification,所以LR模型是一个二分类模型,可以用来做CTR预测等。那么我们现在来引出逻辑回归如何做二分类问题。...
分类:
编程语言 时间:
2015-04-15 19:38:05
阅读次数:
737
最近公司有个购买项目,使用的是oracle数据库,想用PHP直接读取数据库做一些数据分析,这样就需要使用PHP连接oracle! 本地使用的window64+php5.5,需要连接的测试服务器的oracle版本为oracle10g! 1.首先需要打开本php的oci8扩展, 打开php...
分类:
数据库 时间:
2015-04-15 18:55:14
阅读次数:
180
《MATLAB数据分析与挖掘实战》是泰迪科技在数据挖掘领域探索10余年经验总结与华南师大、韩山师院、广东工大、广技师等高校资深讲师联合倾力打造的巅峰之作。全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举。 本书特色:本书作者从实践出发,结合大量数据挖掘工程案例及教学经验,以真实案例为主线,深入...
分类:
其他好文 时间:
2015-04-14 21:27:02
阅读次数:
122
IDC评述网(idcps.com)04月14日报道:根据百度统计最新数据显示,在3月份,国内电脑分辨率市场基本保持稳定状态。环比上月,前十强排名无变化。其中,表现最突出的是分辨率1366*768,占比较上月增加1.25%,升至14.30%,稳坐第一。下面,请看具体数据分析。(图1)3月国内电脑..
分类:
其他好文 时间:
2015-04-14 20:18:29
阅读次数:
171
管理信息化必须是规范化管理,而非个性化管理,例如:同一类别的科研项目的名称不能总是变来变去。如果名称改变,旧名称就不应作为数据分析的依据。所以,一旦要建设数据库,首要的工作就是对数据进行彻底的、不留死角的清洗。
分类:
其他好文 时间:
2015-04-14 09:54:24
阅读次数:
110
[导读] 因为本人公司正处于P2P的行业,分析行业数据,对平台的运营决策有着很大的作用,因此需要爬XX之家的相关数据。1、分析 通过右键查看页面源代码发现页面结构为表格布局,因此设想可以分为四个步骤来采集数据:1、使用爬虫将页面抓取下来;2、对页面数据进行解析;3、入库;4、写个定时服务每天定时抓取...
分类:
其他好文 时间:
2015-04-14 09:43:09
阅读次数:
205