Wesnoth之战是一款开源的回合制策略游戏。游戏世界很丰富,有几个派系,地图和数百个可用单位。在本教程中,您将学习如何将中等大小的数据集(如游戏元数据)转换为有用的格式,以便使用R进行进一步分析。 您将了解整洁数据集遵循的关键原则,为什么跟踪它们有用,以及如何清理您给出的数据。整理也是了解新数据集 ...
分类:
编程语言 时间:
2019-05-24 19:25:36
阅读次数:
141
参考了https://blog.csdn.net/weixin_36220483/article/details/52639469 完整的R语言预测建模实例-从数据清理到建模预测 ...
分类:
编程语言 时间:
2019-05-04 10:03:48
阅读次数:
185
本文总结在使用Excel进行数据分析时,最常用的功能和函数。 Excel的功能和函数非常多,用进废退,除了学习基本的函数和功能,最重要的是遇到问题可以快速的搜索并解决。 首先Excel可以处理的数据量有大多? 使用Ctrl + → , Ctrl + ↓可以看到下界为104,8576,右界为24(X) ...
分类:
其他好文 时间:
2019-04-16 01:14:38
阅读次数:
148
3.1 数据预处理 数据质量的三个要素:准确性、完整性和一致性。 3.1.2 数据预处理的主要任务 数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。 数据集成:相关性分析,卡方,协方差,相关系数 数据归约:大->小,维归约,数据压小 数据变换和数据离散化:规范化 ...
分类:
其他好文 时间:
2019-04-06 22:47:56
阅读次数:
253
茄子快传数据分析(一) 数据清理 2018年09月03日 18:41:44 amin_hui 阅读数:117 茄子快传数据分析(一) 数据清理 2018年09月03日 18:41:44 amin_hui 阅读数:117 茄子快传数据分析(一) 数据清理 茄子快传数据分析(一) 数据清理 2018年0 ...
分类:
其他好文 时间:
2019-04-05 21:31:34
阅读次数:
192
大数据,想必大家近几年都有所耳闻或者已经如雷贯耳了,诚然,大数据的的火爆基本上可谓在大城市人尽皆知了,但是大家可能不知道的是,大数据分析得定义或概念到底是什么。且不说新出的人工智能,就大数据而言,我们一直在强调大数据的技术,大数据技术其实是我们的畅想而已,而且人工智能也离不开大数据分析的支撑,但是大... ...
分类:
其他好文 时间:
2018-12-04 17:08:04
阅读次数:
174
数据库操作中,经常会因为导数据造成数据重复,需要进行数据清理,去掉冗余的数据,只保留正确的数据 一:重复数据根据单个字段进行判断 1、首先,查询表中多余的数据,由关键字段(name)来查询。 select * from table_name where name in (select name fr ...
分类:
数据库 时间:
2018-11-23 12:33:03
阅读次数:
250
一个中等水平的数据科学家每天都要处理大量的数据。一些人说超过60%到70%的时间都用于数据清理、数据处理及格式转化,以便于在之后应用机器学习模型。 这篇文章的重点便在后者—— 应用机器学习模型(包括预处理的阶段)。此文讨论到的内容来源于我参加的过的数百次的机器学习竞赛。请大家注意这里讨论的方法是大体 ...
分类:
其他好文 时间:
2018-11-10 00:56:05
阅读次数:
247
Anaconda自带notebook,notebook本质是一个Web应用程序,用途:数据清理和转换,可视化,机器学习,支持实时代码 。 一.修改默认工作目录 1. 在cmd窗口输入jupyter-notebook --generate-config 得到一个notebook配置文件路径 2. 打开 ...
分类:
其他好文 时间:
2018-10-31 13:59:20
阅读次数:
873
"数据清理" 简书大神SeanCheney的译作,我作了些格式调整和文章目录结构的变化,更适合自己阅读,以后翻阅是更加方便自己查找吧 设定最大列数和最大行数 1 宽格式转长格式 .dataframe tbody tr th:only of type { vertical align: middle; ...
分类:
其他好文 时间:
2018-10-17 00:09:03
阅读次数:
159