上海2月21-24日Cloudera Developer training for Spark and Hadoop(CCA-175)北京2月23-26日Cloudera Developer training for Spark and Hadoop(CCA-175)上海2月27-3月2日Cloud ...
分类:
其他好文 时间:
2017-03-04 12:34:35
阅读次数:
211
[TD精选] 基于100,000篇演讲的分析数据科学家发现了最佳演讲者的特征 相信大部分人一定试图寻找过使得自己的演讲变得更加吸引人,更加有气势的方法。现如今,在大数据工具和机器学习技术的辅助下,找到完美演讲的答案已经变得十分容易。Noah Zandan, CEO of Quantified Com ...
分类:
其他好文 时间:
2017-01-25 16:29:01
阅读次数:
214
//转自 《XGBoost 与 Boosted Tree | 我爱计算机》 1. 前言应 @龙星镖局 兄邀请写这篇文章。作为一个非常有效的机器学习方法,Boosted Tree是数据挖掘和机器学习中最常用的算法之一。因为它效果好,对于输入要求不敏感,往往是从统计学家到数据科学家必备的工具之一,它同时 ...
分类:
其他好文 时间:
2017-01-20 15:54:10
阅读次数:
585
新智元推荐 来源:LinkedIn 作者:Abhishek Thakur 译者:弗格森 【新智元导读】本文是数据科学家Abhishek Thakur发表的Kaggle热门文章。作者总结了自己参加100多场机器学习竞赛的经验,主要从模型框架方面阐述了机器学习过程中可能会遇到的难题,并给出了自己的解决方 ...
分类:
其他好文 时间:
2017-01-17 23:12:30
阅读次数:
1019
http://www.quora.com/What-is-data-science 数据科学是什么? http://www.quora.com/How-do-I-become-a-data-scientist 我怎样才能成为一个数据科学家? http://www.quora.com/Data-Sci ...
分类:
其他好文 时间:
2016-12-28 12:22:49
阅读次数:
189
作者:Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 减少特征数量、降维,使模型泛化能力更强,减少过拟合 增强对特征和特征值 ...
分类:
其他好文 时间:
2016-12-23 16:27:29
阅读次数:
1248
ggfortify 有着简单易用的统一的界面来用一行代码来对许多受欢迎的R软件包结果进行二维可视化的一个R工具包。这让许多的统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进行任何处理就能以 {ggplot} 的风格画出好看的图,大大地提高了工作的效率。 虽然ggfortify已经在CR ...
分类:
其他好文 时间:
2016-12-01 02:52:45
阅读次数:
339
大数据分析的几个新角色:数据科学家、数据分析师、数据(算法)工程师 数学科学家:(发明算法) 运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才。 对享有的模型进行优化、改进,所以涉及到对具体算法的精通和理解,并不 ...
分类:
编程语言 时间:
2016-11-28 00:37:35
阅读次数:
245
分辨真假数据科学家的20个问题及回答 2016-11-14 大数据文摘 【导语】本文分为两个部分,第一部分是quora上很火的一篇问答--【20个分辨真假数据科学家的问题】中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章【KDnuggets编辑们针对这20个问题给出的回答】。 ...
分类:
其他好文 时间:
2016-11-24 14:21:46
阅读次数:
209
数据科学家们,他们想使用更复杂的数据类型实现更复杂的数据分析,了解如何设计?如何应用基础模型来评估内在倾向性或偏差。 业务分析师,他们更像是随性的用户,想要用数据来实现主动数据发现,或者实现现有信息和部分预测分析的可视化。企业经理,他们想要了解模型和结论。IT开发人员,他们为以上所有类用户提供支持。 ...
分类:
其他好文 时间:
2016-11-10 13:46:45
阅读次数:
249