在指定网址下载文件,并放到指定目录 import urllib.request import os url = "xxxxx" data_path = "D:/xxx" if not os.path.isfile(data_path): # 如果不存在文件 ret = urllib.request. ...
分类:
其他好文 时间:
2021-07-23 17:44:16
阅读次数:
0
? 原文链接:http://tecdat.cn/?p=22966 原文出处:拓端数据部落公众号 逻辑回归是一种拟合回归曲线的方法,y=f(x),当y是一个分类变量时。这个模型的典型用途是在给定一组预测因素x的情况下预测y,预测因素可以是连续的、分类的或混合的。 一般来说,分类变量y可以是不同的值。在 ...
分类:
编程语言 时间:
2021-07-07 17:47:33
阅读次数:
0
2.1 缺失值观察与处理 (1)请查看每个特征缺失值个数 df[df.Age.isna()] (2)缺失值处理方法 填充方法: 思考: ...
分类:
其他好文 时间:
2021-06-18 19:22:41
阅读次数:
0
原创:数据臭皮匠 【导读】Kaggle ,作为听说它很牛X但从未接触过的同学,可能仅仅了解这是一个参加数据挖掘比赛的网站,殊不知Kaggle也会有赛题相关的数据集, 比如我们熟知的房价预测、泰坦尼克号乘客生存预测、手写数字识别等,并且每个比赛下面都会有大神分享自己的思路和代码,如果能利用好这些资源, ...
分类:
其他好文 时间:
2021-01-02 10:41:22
阅读次数:
0
import pandas as pd data = pd.read_csv("train.csv") #确定每一列,或者叫每一个series下,是否有空数据 columns_name = data.columns.tolist() columns_name_true_false={} print( ...
分类:
其他好文 时间:
2020-08-17 17:53:50
阅读次数:
108
一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 答: 题目:Kaggle分析数据项目 泰坦尼克号生还预测 二、实践方案 简要说明理由。 三、实践任务分解 根据所选的题目,明确实验步骤,分解任务到每天。 四、实践计划 按任务分解撰写计划表,每天按计划表开展 ...
分类:
其他好文 时间:
2020-06-23 21:18:27
阅读次数:
70
一、选题与意义 2.Kaggle分析数据项目 选择Kaggle的泰坦尼克号生存预测。电脑环境配置不行,主要也还是不会。 二、实践方案 首先准备划分数据集,确定模型,训练模型,模型预测。 三、实践任务分解 准备划分数据集,确定模型,训练模型,模型预测。 四、实践计划 按任务分解撰写计划表,每天按计划表 ...
分类:
其他好文 时间:
2020-06-23 20:56:56
阅读次数:
49
一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 本人电脑硬件相对落后,对运行虚拟机以及处理大量数据方面并不友好,因此我选择第二项kaggle分析数据项目:泰坦尼克号的生存预测。 二、实践方案 简要说明理由。 下载准备好数据集,使用训练数据集对模型行进行训 ...
分类:
其他好文 时间:
2020-06-23 20:56:37
阅读次数:
57
前言 目标:预测测试集中乘客是否会存活 此项目数据集分为2份数据集titanic_train.csv和titanic_test.csv titanic_train.csv: 训练集,共计891条数据 titanic_test.csv: 测试集,共计418条数据 字段 字段说明PassengerId ...
分类:
其他好文 时间:
2020-06-05 15:10:48
阅读次数:
82
本篇文章是承接上一篇文章写的:springboot源码解析(一)-自定义系统初始化器 开篇之前先把祖师爷搬出来 费玉清:问大家一个脑筋急转弯,大家都知道泰坦尼克号的男主角叫杰克,女主角叫螺丝,那问大家泰坦尼克号为什么沉了 思考。。。 思考。。。 思考。。。 揭晓谜底:因为杰克把螺丝搞松了,所以漏水了 ...
分类:
编程语言 时间:
2020-05-29 19:16:05
阅读次数:
82