31页PPT:基于Spark的移动大数据挖掘 31页PPT:基于Spark的移动大数据挖掘 数盟11.16 Data Science Meetup(DSM北京)分享:基于Spark的移动大数据挖掘分享嘉宾:张夏天(TalkingData首席数据科学家) @张夏天_机器学习 内容提要: Talking ...
分类:
移动开发 时间:
2016-11-06 07:49:45
阅读次数:
330
从书中读到数据科学家应具备:计算机科学,数学,统计学,机器学习,某一领域的专业知识,沟通和演讲的技巧,数据可视化等七项技能。统计学家和机器学习专家在处理问题的方式角度有所不同。统计学家认为模型中的参数必须在显示世界中有意义,而软件工程师主要关注如何将算法植入到产品中,他们不会关注模型参数的意义,只是 ...
分类:
其他好文 时间:
2016-10-18 17:58:38
阅读次数:
125
作者:Datartisan链接:https://zhuanlan.zhihu.com/p/22833471来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调整,将原始数据转变为可以 ...
分类:
其他好文 时间:
2016-10-16 16:18:44
阅读次数:
179
原文 http://dataunion.org/14072.html 主题 特征选择 scikit-learn 作者: Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法 ...
分类:
其他好文 时间:
2016-10-14 00:26:00
阅读次数:
304
数据分析师:数据分析工作常见七种错误及其规避技巧商业领域的数据科学家和侦探类似:去探索未知的事物。不过,当他们在这个旅程中冒险的时候,他们很容易落入陷阱。所以要明白,这些错误是如何造成的,以及如何避免。“ ... 数据分析师:数据分析工作常见七种错误及其规避技巧商业领域的数据科学家和侦探类似:去探索 ...
分类:
其他好文 时间:
2016-08-29 12:50:40
阅读次数:
153
随着大数据行业的逐步兴起,相关大数据的职业也成为热门职业,给人才的发展带来了很多机会。数据科学家、数据工程师、数据分析师已经成为大数据行业最热门的职位。那么它们又是如何定义的呢?有什么职责? 1.数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数 ...
分类:
其他好文 时间:
2016-08-22 18:13:53
阅读次数:
142
一款功能丰富、使用简单的数据处理工具无疑可以带来极大的帮助,可以为业务人员、数据分析师和数据科学家节省大量的时间和精力。BigSheets就是这样一款设计用来处理海量数据的图形化工具。...
分类:
其他好文 时间:
2016-07-15 21:33:32
阅读次数:
127
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种 ...
分类:
其他好文 时间:
2016-06-22 12:46:42
阅读次数:
203
目录 前言 第1章导论1 1.1数据的威力1 1.2什么是数据科学1 1.3激励假设:DataSciencester2 1.3.1寻找关键联系人3 1.3.2你可能知道的数据科学家5 1.3.3工资与工作年限8 1.3.4付费账户10 1.3.5兴趣主题11 1.4展望12 第2章Python速成1 ...
分类:
其他好文 时间:
2016-06-14 23:58:08
阅读次数:
597
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。
特征选择主要有两个功能:
减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解...
分类:
其他好文 时间:
2016-06-12 03:17:06
阅读次数:
324