闲来岁月蹉跎、老骥伏枥、才数据处理这般静雅: ...
分类:
其他好文 时间:
2020-04-12 14:56:05
阅读次数:
80
1.分析目的:根据过往电商成交数据进行数据分析发现规律和问题从而指导业务 2.数据 导入库 导入数据 加载好数据之后,第一步先分别使用describe和info方法看下数据的大概分布 加载device_type 3.数据清洗 orderId orderId在一个系统里是唯一值 先看下有没有重复值 如 ...
分类:
其他好文 时间:
2020-04-12 10:18:51
阅读次数:
101
一、流的概念,与集合的异同 1、流 集合的stream方法,它会返回一个流,可以看成遍历数据集的高级迭代器。简单的定义 “从支持数据处理操作的源生成的元素序列”。 元素序列——就像集合一样,流也提供了一个接口,可以访问特定元素类型的一组有序 值。因为集合是数据结构,所以它的主要目的是以特定的时间/空 ...
分类:
编程语言 时间:
2020-04-11 23:32:52
阅读次数:
84
3-4讲的没有意义,直接过了 1 重点 概念解析中的定义 Stream流的组成 Stream流和集合的区别 2 概念解析 定义: 从支持数据处理操作的源生成的元素序列。 解释: 元素序列:和集合一样,流也是一个接口,可以访问特定元素类型的一组有序值,有序值就是元素序列 源:为流提供数据的源头,比如集 ...
分类:
编程语言 时间:
2020-04-11 10:04:06
阅读次数:
80
本篇我们来说:下载和处理json格式的文件,并通过pygal中的地图工具来实现数据可视化 总体思路: #1.下载世界人口数量数据文件,提取数据,我们选择分析2010年的人口数量数据#2.数据处理:将数据转换为pygal_maps_world能处理的格式#3.将世界人口划分3大范围:0-1千万、1千万 ...
分类:
编程语言 时间:
2020-04-11 09:20:17
阅读次数:
134
一、项目预期目标(一)建立三维GIS平台建立三维可视化、多元化海域陆域集成部分地理信息平台。(二)实现三维GIS多领域化应用实现三维GIS应用到资源开发、数字城市建设、海洋开发等多领域,实现价值多元化目的。(三)真四维时空GIS在三维GIS平台的基础上,实现真四维时空GIS。(四)利用数据挖掘技术进行知识发现空间数据挖掘是从空间数据库中抽取隐含的知识、空间关系以及其他非显式的包含在空间数据库中但以
分类:
其他好文 时间:
2020-04-10 17:10:38
阅读次数:
149
0. 需求 当训练的数据非常多时,是不希望分配过多的内存将数据存入,否则其他占用内存的数据处理步骤就没法进行了。我们最好是以小批量地方式读入数据,然后预处理,然后送到网络,之后释放内存,以此循环。 1. 方法的简要说明 tf.keras中有一个高度封装的图片预处理类:ImageDataGenerat ...
分类:
其他好文 时间:
2020-04-10 09:17:28
阅读次数:
174
在 "前面" 的学习中主要了解了Pandas如何构造序列和数据框,如何读取和写入各种格式的数据,以及如何对数据进行初步描述,本文将进一步了解Pandas如何处理字符串和日期数据,数据清洗,获取数据子集,透视表,分组聚合操作等内容。 4. Pandas处理字符串和日期数据 待处理的数据表 数据处理要求 ...
分类:
编程语言 时间:
2020-04-09 12:58:30
阅读次数:
103
Pands模块可以帮助数据分析师轻松地解决数据的预处理问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。Pandas模块的核心操作对象就是序列(Series)和数据框(DataFrame)。序列可以理解为数据集中的一个字段,数据框是指含有至少两个字段(或序列)的数据集。 1. 序列 ...
分类:
编程语言 时间:
2020-04-09 12:20:02
阅读次数:
97
随着大型网站的各种高并发访问、海量数据处理等场景越来越多,如何实现网站的高可用、易伸缩、可扩展、安全等目标就显得越来越重要。为了解决这样一系列问题,大型网站的架构也在不断发展。提高大型网站的高可用架构,不得不提的就是分布式。 一、集中式系统 集中式系统用一句话概括就是:一个主机带多个终端。终端没有数 ...
分类:
其他好文 时间:
2020-04-08 19:00:12
阅读次数:
97