Visualization of seaborn seaborn[1]是一个建立在matplot之上,可用于制作丰富和非常具有吸引力统计图形的Python库。Seaborn库旨在将可视化作为探索和理解数据的核心部分,有助于帮人们更近距离了解所研究的数据集。无论是在kaggle官网各项算法比赛中,还是 ...
分类:
编程语言 时间:
2019-07-14 15:08:36
阅读次数:
430
1.3 项目计划 第一周:深入学习和了解神经网络的工作原理,学习卷积的相关理论。 第二周:使用python的TensorFlow库,编写神经网络深度学习代码,搭建神经网络层,并且了解其工作原理和相关的计算、相关参数的传递等,到htttps://www.kaggle.com/moltean/fruit ...
分类:
其他好文 时间:
2019-07-11 20:19:31
阅读次数:
98
kaggle总结python ML 一、特征分析(EDA,探索性数据分析) 1.1 seaborn特征分析roc_curelineplot("X", "y", data=df))一个特征不同值对生的影响,有限个数:barplot("X", "y", data=df)连续且个数比较多sns.distp... ...
分类:
其他好文 时间:
2019-07-03 13:39:26
阅读次数:
156
MNIST数字识别是机器学习项目的经典案例,在Kaggle上也有此项比赛,本文中的代码是使用TensorFlow+CNN进行处理的。 我已将代码放到了我的Github上,有兴趣的朋友可以看一下。 一共四个文件: main.py是主程序模块。 trainModel.py是训练模型模块。 constan ...
分类:
其他好文 时间:
2019-06-21 21:05:09
阅读次数:
131
学习Python必须的一些书籍 1、python编程快速上手 让繁琐工作自动化 2、Python高手之路 第三版 3、Python核心编程 第三版 4、Python极客项目编程 5、Python机器学习及实践--从零开始通往kaggle竞赛之路 6、Python绝技 7、笨办法学习Python 第三 ...
分类:
编程语言 时间:
2019-06-16 11:26:37
阅读次数:
104
!pip install kaggle #!mkdir -p ~/.kaggle #建立kaggle 文件夹 from google.colab import files files.upload() #cd + 移动到文件夹 !kaggle + 数据集(有API接口) ...
分类:
其他好文 时间:
2019-06-14 20:05:25
阅读次数:
105
基于tf2.0 对Kaggel Google street view characters classify 项目练手, 熟悉一下tf2.0的新特性 下载下来kaggle的数据集如下: 所有训练数据在train文件夹中, labels在trainLabels.cvs文件中, label文件格式如下: ...
分类:
其他好文 时间:
2019-06-04 22:21:53
阅读次数:
352
上次已经讲了怎么下载数据,这次就不说废话了,直接开始。首先导入相应的模块,然后检视一下数据情况。对数据有一个大致的了解之后,开始进行下一步操作。 一、分析数据 1、Survived 的情况 2、Pclass 和 Survived 之间的关系 3、Embarked 和 Survived 之间的关系 二 ...
分类:
其他好文 时间:
2019-05-31 19:30:53
阅读次数:
134
上一篇博客用词袋模型,包括词频矩阵、Tf-Idf矩阵、LSA和n-gram构造文本特征,做了Kaggle上的电影评论情感分类题。 这篇博客还是关于文本特征工程的,用词嵌入的方法来构造文本特征,也就是用word2vec词向量和glove词向量进行文本表示,训练随机森林分类器。 一、训练word2vec ...
分类:
其他好文 时间:
2019-05-19 18:10:28
阅读次数:
149
现在自然语言处理用深度学习做的比较多,我还没试过用传统的监督学习方法做分类器,比如SVM、Xgboost、随机森林,来训练模型。因此,用Kaggle上经典的电影评论情感分析题,来学习如何用传统机器学习方法解决分类问题。 通过这个情感分析的题目,我会整理做特征工程、参数调优和模型融合的方法,这一系列会 ...
分类:
其他好文 时间:
2019-05-19 11:49:23
阅读次数:
224