码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据分析 数据挖掘    ( 7783个结果
2013年十大必知的大数据分析公司
2013年,大数据和数据分析技术将持续升温,相关创业公司也如雨后春笋一般让人们目接不暇。 最近大数据分析专家Robin Bloor 根据技术创新性, 技术路线等评判标准, 列出了10家值得关注的大数据分析技术公司,IT经理网编译整理如下:Actuate:Actuate与Eclipse基金会合作的的开...
分类:其他好文   时间:2014-06-12 19:26:45    阅读次数:294
Spark1.0.0生态圈一览
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通过Spark生态圈,AMPLab运用大数据、云计算、通信等各种资源,以及各种灵活的技术方案,对海量不透明的数...
分类:其他好文   时间:2014-06-11 06:59:31    阅读次数:288
如何进行产品定位(上)
这段时间在从事游戏社区化方向的策划,为某款游戏定制化社区。 针对该款游戏做了一次深入的数据挖掘,其中一项数据特别有意思。对游戏中的好友关系进行统计,其中玩家好友数在1-5个的占了70%,6-10个的11%,平均好有数6个。 这些数据公开之后,大家对社区化价值有了不同的看法。 技术GG很失落地说:好友数这么低,做社区做聊天做关系链没任何价值啊! 我:应该双面看待这项数据。好友数少...
分类:其他好文   时间:2014-06-11 06:18:59    阅读次数:262
图表Web组件提供2D和3D图表类型控件Nevron Chart for SharePoint
Nevron Chart for SharePoint是一个先进的图表Web组件,其能为您的SharePoint站点提供一整套的2D和3D图表类型,高度可自定义的轴,先进的数据分析功能,严密的数据集成和无与伦比的视觉效果。其组合了业内领先的Nevron Charting engine for ASP...
分类:Web程序   时间:2014-06-10 21:17:17    阅读次数:322
输入法之模型训练
输入法,尤其是拼音输入法,解决的就是一些序列标注的问题,针对给定的状态(拼音),获取其概率最高的隐状态(中文)。 这个是一个标准的HMM,针对HMM的解码过程,是一个很成熟也很完备的东西。 local的计算和存储能力都有限,我们选择一般是二阶马尔科夫,也就是所谓的bigram model。 高阶对质量会有帮助,但是涉及到存储和计算,工程上不可行。 同理,利用ME 以及CRFmodel...
分类:其他好文   时间:2014-06-10 18:18:23    阅读次数:208
中国空气质量分析
由于不懂如何自律,中国人现在享受经济发展的同时却需要担心空气、水、食品等必需品。特别是空气问题,促成了口罩与空气滤清器等行业,却也极大影响了人们的工作生活。在这么下去最火的乐队绝对是Air Supply了,没有之一。 抱怨之外,让我们看看能不能从数据的角度分析一下空气质量及其成因。 首先非常感谢PM25.in网站提供的空气质量API,以至于我们可以轮询并把AQI(空气质量指数)数据储存...
分类:其他好文   时间:2014-06-10 07:19:26    阅读次数:574
GitHub上编程语言流行度分析
GitHub已然是全球最流行的开源项目托管平台,项目数量目前已经达到了千万级别。Adereth在Counting Stars on GitHub一文提供了一个非常有意思的思路,那就是籍GitHub用户通过星星标记感兴趣项目的数目,来观察GitHub中用户最流行的是什么编程语言。 老规矩,让我们用Power BI来分析一下吧。首先从Adereth的博客下载相关数据,然后用Power Query倒入...
分类:编程语言   时间:2014-06-10 07:18:01    阅读次数:642
用Power BI观察经济与健康的关系
Hans Rosling是卡罗琳学院的国际卫生学教授,这位学者与众不同的技能是数据可视化,以直观的数据展现了令人信服的世界观,并且在gapminder.org提供无偿展示以及下载。如果你没有看过以下的TED讲座,真心建议你花点时间,保证物有所值: Hans Rosling: Asia’s rise — how and whenHans Rosling: Let my dataset ch...
分类:其他好文   时间:2014-06-10 06:21:50    阅读次数:336
【转】百亿级实时大数据分析项目,为什么不用Hadoop?
百亿数量级的大数据项目,软硬件总体预算只有30万左右,需求是进行复杂分析查询,性能要求多数分析请求达到秒级响应。 遇到这样的项目需求,预算不多的情况,似乎只能考虑基于Hadoop来实施。 理论上Hadoop撑住百亿数量级没问题,但想要秒级响应各种查询分析就不行了。我们先大概分析一下Hadoop的优缺...
分类:其他好文   时间:2014-06-09 14:32:39    阅读次数:509
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!