内容来源: https://jakevdp.github.io/PythonDataScienceHandbook/00.00-preface.html 1、什么是机器学习 机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论支持、又没有高效的计算方法 ...
分类:
其他好文 时间:
2020-03-18 11:39:56
阅读次数:
54
数据分析 什么是数据分析? 定义:把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律,使数据价值最大化。数据分析是使用适当的方法对手机来的大量数据进行分析,帮助人们做出判断,以便采取适当的 行动。 为什么学习数据分析? 1、他有岗位要求。 2、它是Python数据科学的基础 ...
分类:
其他好文 时间:
2020-03-11 01:00:20
阅读次数:
88
数据科学职位的典型面试过程会有很多轮,其中通常会涉及理论概念,目的是确定应聘者是否了解机器学习的基础知识。 在这篇文章中,我想总结一下我所有的面试经历(面试or被面试)并提出了160多个数据科学理论问题的清单。 其中包括以下主题: 线性回归 模型验证 分类和逻辑回归 正则化 决策树 随机森林 GBD ...
分类:
其他好文 时间:
2020-03-06 11:23:59
阅读次数:
95
data science,最近看了国内外很多相关的书,真的是越看越觉得懂得少,这个学科太交叉性学科了,内容量太大,说实话,真的不容易讲的深入浅出。希望我讲完后学生不要都觉得难得学不下去。 交叉学科有个特点就是面广,但是每个面并不要求一步到位,你可以选择一个你感兴趣的方向,在以后继续深入。比如可以选择 ...
分类:
其他好文 时间:
2020-02-24 00:15:25
阅读次数:
62
什么是IPython?可能很多人已经在用,却不知道它到底是什么。 根据维基百科的解释: IPython是一种基于Python的交互式解释器,提供了强大的编辑和交互功能。 IPython拥有: 1. 满足你各种需求的交互式shell 2. 火爆数据科学社区的Jupyter内核(供Jupyter Not ...
分类:
编程语言 时间:
2020-02-18 12:48:51
阅读次数:
83
1. 数据科学领域中常用的python库 Numpy库:数据运算的基础库,运行效率高(底层C语言,高效index) Scipy库:实现了常用的科学计算方法(线性代数,傅里叶变换,信号和图像处理) Pandas库:分析数据的利器,高级数据结构(Series,DataFrame) Matplotlib库 ...
分类:
编程语言 时间:
2020-02-12 19:04:47
阅读次数:
101
百融榕树使用Python的优势在于资源丰富,拥有坚实的数值算法、图标和数据处理基础设施,建立了非常良好的生态环境。百融榕树并不是所有的部门都能自己生产数据,用于决策辅助,更多的百融榕树互联网大部分都是靠爬虫来抓取互联网数据进行分析。而百融榕树的Python在网络爬虫领域有着强势地位,Python的战略定位就是做一种简单、易用但专业、严谨的通用言语组合。百融榕树的数据和数据科学领域,它在web前端开
分类:
编程语言 时间:
2020-02-12 18:52:10
阅读次数:
73
引言:上篇Kagging金大叔的数据科学之路(一)提到我加入Kaggle3个月又27天,拿下两枚银牌成为Expert,全球排名Top2.5%。今天来撸一撸如何Kaggle比赛。(为什么要参加Kaggle比赛,再作探讨#TODO#)
万物皆数据,数据科学正在改变世界。说到数据科学就绕不开Kaggle-... ...
分类:
其他好文 时间:
2020-02-07 10:33:05
阅读次数:
175
Keras Linux Python Panda Numpy Matplotlib Scikit Learn ...
分类:
其他好文 时间:
2020-01-31 22:39:27
阅读次数:
81
如果没有任何编程基础,想学习如何使用R,并进行练习,建议大家看看《学习R》电子书和代码资料,上半部分主要介绍R的技术细节和使用技巧,下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程。 《学习R》电子书,帮助学习编写简单的R程序,知道R语言能做什么: 1.使用向量、数组、列表、数据 ...
分类:
编程语言 时间:
2020-01-31 14:36:00
阅读次数:
98