特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法...
分类:
其他好文 时间:
2015-12-10 13:09:43
阅读次数:
187
俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道..
分类:
其他好文 时间:
2015-11-23 19:23:20
阅读次数:
174
本文转自:http://www.36dsj.com/archives/34020当谈及到分析你编纂的数据时,有大量的工具可以帮助你更好的理解数据,本文总结出了一个包括5个数据科学工具的列表,同时这也是你在当今的社会形势下人们应该掌握的5个数据科学工具。即使是知识渊博的数据科学家也能提升他们的技术水平...
分类:
其他好文 时间:
2015-10-01 20:31:19
阅读次数:
200
数据挖掘:What?Why?How? 这个问题思考了很久,作为过来人谈一谈,建议先看下以前的一些回答。 什么是数据挖掘? 怎么培养数据分析的能力? 如何成为一名数据科学家? 磨刀不误砍柴工。在学习数据挖掘之前应该...
分类:
其他好文 时间:
2015-09-19 18:24:08
阅读次数:
277
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。
特征选择主要有两个功能:
减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解
拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择...
分类:
其他好文 时间:
2015-08-04 19:29:04
阅读次数:
312
数据科学家可能成为2015年最热门职业 腾讯科技讯 1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌? 如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了——LinkedIn的最新投票结果显示,"统计分析和数据挖掘" 是2...
分类:
其他好文 时间:
2015-07-27 20:54:59
阅读次数:
155
注:本文为线下活动【CTO辩论会】移动创业大军:挣扎者or变革者实录,AppCan CTO赵庆华、Testin CTO 尹春鹏、云智慧CEO殷晋、TalkingData CTO肖文峰、爱加密CTO林魏、极光推送首席数据科学家黄鑫、51CTO学院技术总监李明小参与讨论。6位CTO从企业发展、技术探索、工作中的困惑到当下活跃的创业,探寻技术人在大潮中的瓶颈和机会。本文内容由活动参与方爱加密提供,篇幅较...
分类:
其他好文 时间:
2015-07-01 10:03:25
阅读次数:
265
发表于2015-03-24 22:58|11934次阅读| 来源个人博客|26条评论| 作者Tomasz Malisiewicz模式识别深度学习机器学习数据科学家摘要:本文我们来关注下三个非常相关的概念(深度学习、机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)的联系,...
分类:
其他好文 时间:
2015-05-19 16:27:25
阅读次数:
125
数据科学(Data Science)是从数据中提取知识的研究,关键是科学。数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机 编程,统计学,数据工程,模式识别和学习...
分类:
其他好文 时间:
2015-04-14 13:10:52
阅读次数:
115
Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐1.本书全面、系统地介绍了Spark源码,深入浅出,细致入微2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序....
分类:
Web程序 时间:
2015-04-09 06:22:34
阅读次数:
163