微软已经发布了其 Visual Studio Tools for AI 的测试版本,这是微软 Visual Studio 2017 IDE 的扩展,可以让开发人员和数据科学家将深度学习模型嵌入到应用程序中。Visual Studio Tools for AI 工具同时支持 Microsoft 的 C ...
分类:
其他好文 时间:
2017-11-26 11:06:41
阅读次数:
272
此随笔记录自己读过的,并且自己认为有所价值,有所感悟的书籍 ps: {e} 有电子书 ,{p} 有实体书 更新 11月底 数据天才:数据科学家的修炼之道 7月(来到杭电) {p}Tensorflow:实战Google深度学习框架 关于TensorFlow的介绍性书籍 这本书与下本书相结合,可以在简单 ...
分类:
其他好文 时间:
2017-11-24 22:50:33
阅读次数:
159
Hi、大家好,我是钟义林,好久好久不见,对,我的充值VIP账号又忘了密码了,O(∩_∩)O哈哈~,今天写个linux安装Anacomda。那么下面我们开始吧!!首先什么是Anaconda呢?Anaconda是一个科学发现版的Python,官方宣称继承了1000+的数据科学软件包。虽然有时间经常打不开他的官网..
分类:
其他好文 时间:
2017-11-15 17:05:20
阅读次数:
627
从Kaggle上获取的这份数据集,是从超过15000个专业的数据科学家收集的数据,让我们对他们的偏好、工作、学习资源和技术水平有了一个非常好的了解。 以下的分析中,简单的从几个方面对数据科学家的现状进行分析。 我们有超过16716人的数据。由于问题的数量实在是太大了(总共超过300个),所以指望人们 ...
分类:
其他好文 时间:
2017-11-13 21:39:25
阅读次数:
222
pandas使用 4/5/2014 13:34 Apples 730 4/5/2014 3:41 Cherries 851 4/6/2014 12:46 Pears 142 4/8/2014 8:59 Oranges 523 4/10/2014 2:07 Apples 1524 4/10/2014 ...
分类:
其他好文 时间:
2017-11-05 15:07:51
阅读次数:
143
【机器学习实验】scikit-learn的主要模块和基本使用 引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实 ...
分类:
其他好文 时间:
2017-11-05 00:30:35
阅读次数:
173
xgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。在数据科学方面,有大量kaggle选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分布式版本有广泛的可 ...
分类:
编程语言 时间:
2017-11-01 16:33:49
阅读次数:
370
导读: 在过去的几个月里,很多人要求我写出一个数据科学项目端到端所需要做的工作,即从业务问题定义阶段到建模阶段及其最终部署。我仔细考虑过这个需求,而且认为这是有道理的。数据科学文献充满了关于具体算法或确定方法的文章以及如何处理问题的代码。然而,对于针对特定业务用例进行数据科学项目所需要的端到端视图很 ...
分类:
其他好文 时间:
2017-10-31 20:13:48
阅读次数:
165
DataFrame提供了一条联结所有主流数据源并自动转化为可并行处理格式的渠道,通过它Spark能取悦大数据生态链上的所有玩家,无论是善用R的数据科学家,惯用SQL的商业分析师,还是在意效率和实时性的统计工程师。 以一个常见的场景 -- 日志解析为例,有时我们需要用到一些额外的结构化数据(比如做IP ...
分类:
数据库 时间:
2017-10-27 01:30:36
阅读次数:
353
Anaconda 是一个包含数据科学常用包的 Python 发行版本。它基于 conda ——一个包和环境管理器——衍生而来。你将使用 conda 创建环境,以便分隔使用不同 Python 版本和不同程序包的项目。你还将使用它在环境中安装、卸载和更新包。通过使用 Anaconda,处理数据的过程将 ...
分类:
其他好文 时间:
2017-10-26 23:11:20
阅读次数:
259