第一个问题,什么是 Python ?根据 Python 之父 Guido van Rossum 的话,Python 是: 一种高级程序语言,其核心设计哲学是代码可读性和语法,能够让程序员用很少的代码来表达自己的想法。 对于我来说,学习 Python 的首要原因是,Python 是一种可以优雅编程的语 ...
分类:
编程语言 时间:
2018-01-13 11:23:35
阅读次数:
217
原文地址如下: https://www.kaggle.com/startupsci/titanic-data-science-solutions 看完一遍,什么也没记住,于是干脆直接翻译一遍。 然鹅,依旧没记住什么。 泰坦尼克数据科学解决方案: 1. 工作流程步骤: 在 Data Science S ...
分类:
其他好文 时间:
2018-01-03 22:34:38
阅读次数:
1214
本文翻译自文章: Pandas Cheat Sheet - Python for Data Science ,同时添加了部分注解。 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优 ...
分类:
其他好文 时间:
2018-01-03 00:48:48
阅读次数:
226
众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容。此次课程以《星际争霸II》回放文件分析为例,集中在IBM Cloud相关数据分析服务的应用。面对星际游戏爱好者希望提升技能的要求,我们使用IBM Data Science ...
分类:
其他好文 时间:
2018-01-02 01:25:10
阅读次数:
227
作者简介:akshay pai,数据科学工程师,热爱研究机器学习问题。Source Dexter网站创办人。 TensorFlow是Google的开源深度学习库,你可以使用这个框架以及Python编程语言,构建大量基于机器学习的应用程序。而且还有很多人把TensorFlow构建的应用程序或者其他框架 ...
分类:
其他好文 时间:
2017-12-30 22:38:26
阅读次数:
253
当前,数据可视化已经成为数据科学领域非常重要的一部分。不同网络系统中产生的数据,都需要经过适当的可视化处理,以便更好的呈现给用户读取和分析。 对任何一个组织来说,如果能够充分的获取数据、可视化数据和分析数据,那么就能很大程度上帮助了解数据产生的深层次原因,以便据此做出正确的决定。 对于前端开发人员来 ...
分类:
编程语言 时间:
2017-12-25 11:34:53
阅读次数:
150
数据预处理 1数据质量 基本属性:正确性,完整性,一致性 2数据审计 运用一定的规律和评价方法,发现数据中存在的问题。如:缺失值,噪声值,不一致值,不完整值。 数据审计的三种类型:预定义审计,自定义审计,可视化审计 3数据清洗 3.1缺失数据清洗 三个活动:缺失识别,缺失分析,缺失处理 方法:较为简 ...
分类:
其他好文 时间:
2017-12-24 12:44:48
阅读次数:
145
数据科学的基础概念 1数据 1.1数据模型 概念模型:用户视角—各种文档,业务流程图,er图等 逻辑模型:数据科学家视角—关系模型,层次模型,网状模型 key-value,key-document,key-column和图模型等,常用格式:关系表,csv,json,xml,rdf等 物理模型:机器视 ...
分类:
其他好文 时间:
2017-12-23 01:08:53
阅读次数:
258
12月22日至23日,高可用架构和msup联合主办的GIAC 全球互联网架构大会将于上海光大会展中心举行。GIAC 全球互联网架构大会是高可用架构技术社区推广的面向架构师、技术负责人及高端技术从业人员的技术架构大会。GIAC于2016年12月成功举办了第一届,而今年的 GIAC 已经有腾讯、阿里巴巴 ...
分类:
其他好文 时间:
2017-12-11 11:17:05
阅读次数:
140
深度学习框架哪家强:TensorFlow?Caffe?MXNet?Keras?PyTorch?对于这几大框架在运行各项深度任务时的性能差异如何,各位读者不免会有所好奇。 微软数据科学家Ilia Karmanov最新测试的结果显示,亚马逊MXNet在CNN、RNN与NLP情感分析任务上性能强劲,而Te ...
分类:
Web程序 时间:
2017-12-02 22:07:12
阅读次数:
387