数据集下载地址: https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv 视频地址: http://study.163.com/course/courseLearn.htm?courseId=1003551009#/learn/ ...
分类:
编程语言 时间:
2018-03-04 21:24:41
阅读次数:
602
上午从哥那里回来,到学校已经一点多了,看了《鸟哥的Linux私房菜》的Bash编程以及正则表达式的部分,实在看得有点闷了又把kaggle账号激活了,花了整整一个下午,才弄好,终于可以开始kaggle练习了。下午吃饭听师兄师姐说起老板有些不高兴,心里也有点发怵,害怕老板问起我,毕竟寒假就只顾着玩了。明 ...
分类:
其他好文 时间:
2018-03-02 01:12:58
阅读次数:
174
学完了Coursera上Andrew Ng的Machine Learning后,迫不及待地想去参加一场Kaggle的比赛,却发现从理论到实践的转变实在是太困难了,在此记录学习过程. 一:安装Anaconda 教程大多推荐使用Jupyter Notebook来进行数据科学的相关编程,我们通过Anaco ...
分类:
其他好文 时间:
2018-03-01 19:57:14
阅读次数:
538
1. 引入所有需要的包 2. 读入数据源 3. 分析数据 查看整体数据的情况(包含训练数据和预测数据,看哪些字段有缺失值,需要填充) 总结:所有的数据中一共包括12个变量,其中7个是数值变量,5个是属性变量 PassengerId(忽略):这是乘客的编号,显然对乘客是否幸存完全没有任何作用,仅做区分 ...
分类:
其他好文 时间:
2018-03-01 13:36:44
阅读次数:
649
作者:大树 更新时间:01.20 email:59888745@qq.com 数据处理,机器学习 回主目录:2017 年学习记录和总结 In [ ]: Kaggle上有很多有意思的项目,大家得空可以试着做一做,其中有个关于香港赛马预测的项目,若大家做的效果好, 预测的结果准确度高的话,可以轻松的 g ...
分类:
其他好文 时间:
2018-02-05 14:32:44
阅读次数:
378
Titanic生存预测 ——数据模型汇总报告 摘要 R语言多元统计分析课程是一门综合理论和实践的大课程,既需要我们掌握基本的多元统计分析技术理论,又需要针对具体问题在R的环境中实现。 本文在基本的多元统计分析技术理论基础上,结合机器学习基本模型,挑选了Kaggle(数据建模竞赛网站)的入门赛——Ti ...
分类:
编程语言 时间:
2018-01-13 20:49:51
阅读次数:
3562
数据为kaggle社区发布的数据分析从业者问卷调查分析报告,其中涵盖了关于该行业不同维度的问题及调查结果。本文的目的为提取有用的数据,进行描述性展示。帮助新从业的人员更全方位地了解这个行业。 参考学习视频:http://www.tianshansoft.com/ 数据集:https://pan.ba ...
分类:
其他好文 时间:
2018-01-06 22:14:38
阅读次数:
1524
原文地址如下: https://www.kaggle.com/startupsci/titanic-data-science-solutions 看完一遍,什么也没记住,于是干脆直接翻译一遍。 然鹅,依旧没记住什么。 泰坦尼克数据科学解决方案: 1. 工作流程步骤: 在 Data Science S ...
分类:
其他好文 时间:
2018-01-03 22:34:38
阅读次数:
1214
分享一篇kaggle入门级案例,泰坦尼克号幸存遇难分析。 参考文章: 技术世界,原文链接 http://www.jasongj.com/ml/classification/ 案例分析内容: 案例分析内容: 通过训练集分析预测什么人可能生还,并对测试集中乘客做出预测判断 案例分析 加载包 1 libr ...
分类:
其他好文 时间:
2017-12-23 23:13:31
阅读次数:
547
集成开发环境:Pycharm python版本:2.7(anaconda库) 用到的库:科学计算库numpy,数据分析包pandas,画图包matplotlib,机器学习库sklearn 大体步骤分为三步: 1.数据分析 2.交叉验证 3.预测并输出结果 导入库函数 第一步:数据分析 1.1通过画图 ...
分类:
其他好文 时间:
2017-12-15 18:15:54
阅读次数:
235