# -*- coding: utf-8 -*- """ Created on Mon Oct 9 14:05:41 2017 @author: lenovo """ import numpy as np import pandas as pd #载入数据,合并测试集和训练集做特征处理 data_tr... ...
分类:
其他好文 时间:
2017-10-09 17:42:21
阅读次数:
336
1.关于年龄Age 除了利用平均数来填充,还可以利用正态分布得到一些随机数来填充,首先得到已知年龄的平均数mean和方差std,然后生成[ mean-std, mean+std ]之间的随机数,然后利用这些随机值填充缺失的年龄。 2.关于票价Fare 预处理:训练集不缺,测试集缺失1个,用最高频率值 ...
分类:
其他好文 时间:
2017-10-01 22:58:59
阅读次数:
149
PC端的UserAgent safari 5.1 – MAC User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 ...
分类:
其他好文 时间:
2017-09-14 23:46:59
阅读次数:
4896
当我们的数据存在多重共线性时,即其中的一个自变量可以用其他一个或几个自变量的线性表达式进行表示,你会发现,拟合之后的方差会特别大 一般说来当解释变量的容忍度(TOLERANCE)小于0.10或者方差膨胀因子(VIF)大于10时,说明变量之间存在多重共线性现象,会影响到回归模型的正确估计。 方差膨胀因 ...
分类:
其他好文 时间:
2017-09-06 23:59:31
阅读次数:
391
题目: Part of Series 1/3 This kata is part of a series on the Morse code. After you solve this kata, you may move to the next one. 系列的一部分,1/3 这个形是莫尔斯电码系 ...
分类:
其他好文 时间:
2017-08-19 20:00:18
阅读次数:
176
1. pom.xml ==> Depency 2. BaseTest.java 3. Sample ...
分类:
编程语言 时间:
2017-08-17 18:40:14
阅读次数:
195
内地电影票房总排行榜 内地电影票房总排行榜 年度排名历史排名电影名称总票房总人次总场次上映年份操作 0 0 战狼2 -- -- 2017 数据纠错 1 2 美人鱼 -- -- 2016 数据纠错 2 3 速度与激情8 -- -- 2017 数据纠错 1 4 捉妖记 -- -- 2015 数据纠错 2 ...
分类:
其他好文 时间:
2017-08-13 12:36:27
阅读次数:
1346
一、概述 Linux 组配置(/etc/group)文件分为4个字段,分别为: 组名、组密码、GID和组成员。 二、示例 [root@titan ~]# cat /etc/group | grep fruit fruit:x:1001: 其中,fruit为组名,x为组密码,1001为GID,组成员字 ...
分类:
系统相关 时间:
2017-08-11 21:10:26
阅读次数:
227
当设置粘着位时只有root或者owner才能删除、重命名文件。 示例: 用户apple默认组为fruit。 [root@titan ~]# id apple uid=1001(apple) gid=1001(fruit) 组=1001(fruit) step1 显示water文件夹信息,文件夹当前未 ...
分类:
系统相关 时间:
2017-08-10 22:22:44
阅读次数:
317
package kaggle import org.apache.spark.SparkContext import org.apache.spark.SparkConf import org.apache.spark.sql.{SQLContext, SparkSession} import or... ...
分类:
其他好文 时间:
2017-05-26 16:38:01
阅读次数:
274