GAN Generative Adversarial Networks 生成对抗网络.学习真实世界的真实数据的分布,用于创造以假乱真的数据.比如前段时间很火的应用deep fake.deep nude. 由两部分构成,生成网络g,对抗网络d. g用于创建假的数据.d用于判别数据.d和我们平常用的神经 ...
分类:
其他好文 时间:
2019-07-27 12:50:03
阅读次数:
119
前言:机器学习所使用的数据大多具有很多的特征,想要直观的对数据的分布和特征之间的关系进行观测,需要将数据的主要特征提取出来,降低到三维及三维以下的空间来展示。 PCA(主成分分析)是常用的用于降维的方法,本文通过PCA对数据进行降维,再对降维后的数据用K-means算法聚类,以达到在低维空间可直观观 ...
分类:
其他好文 时间:
2019-07-19 21:20:35
阅读次数:
141
待处理数据的缺失和错误会极大地影响后续的数据分析,因:我们首先需要评估数据质量,进行诸如缺失值发现、极端值诊断、统计分布(样本数据的分布情况)观察和描述性统计(包括均值、方差、标准差、偏度、峰度等)等操作。 在本课节中,老师从北京市空气质量监测数据集入手,系统介绍以上知识点,帮助学员获得洞察数据的能 ...
分类:
其他好文 时间:
2019-07-15 16:02:00
阅读次数:
158
1. 简介首先简要介绍一下生成模型(Generative model)与判别模型(Discriminative mode)的概念: 生成模型:对联合概率进行建模,从统计的角度表示数据的分布情况,刻画数据是如何生成的,收敛速度快,例如朴素贝叶斯,GDA,HMM等。 判别模型:对条件概率P(Y|X) 进 ...
分类:
其他好文 时间:
2019-07-12 09:37:51
阅读次数:
543
一、简介 seaborn是Python中基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到seaborn中内置的若干函数对数据的分布进行多种多样的可视化,本文以jupyter notebook为编辑工具,针对seaborn中 ...
分类:
其他好文 时间:
2019-07-03 22:46:29
阅读次数:
140
一、原理 桶排序是计数排序的升级版,如果计数排序中数的范围比较大呢?之前的计数排序数字范围是1-200,假如1-20000呢?利用桶排序就可以对其进行优化。 步骤: (1)将元素分在不同的桶中 (2)在对每一个桶中的元素进行排序 桶排序的的快慢取决于数据的分布: 当输入的数据可以均匀的分配到每一个桶 ...
分类:
编程语言 时间:
2019-06-30 17:15:51
阅读次数:
104
大数据是一系列技术的统称,经过多年的发展,大数据已经形成了从数据采集、整理、传输、存储、安全、分析、呈现和应用等一系列环节,这些环节涉及到诸多大数据工作岗位,这些工作岗位与物联网、云计算也都有密切的联系。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是用Java语言开发的一个开源分布式计算平台,适合大数据的分布式存储和计算平台。广义上讲,大数据是时代发展和技术进步的产物。Had
分类:
其他好文 时间:
2019-06-27 12:17:57
阅读次数:
107
Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是用Java语言开发的一个开源分布式计算平台,适合大数据的分布式存储和计算平台。今天加米谷大数据就来简单介绍一下Hadoop的简史,以及学习Hadoop前要做哪些准备。狭义上,Hadoop就是单独指代Hadoop这个软件;广义上,Hadoop指代大数据的一个生态圈,包括很多其他的软件。Hadoop的起源1、2001年,Nutch问世
分类:
其他好文 时间:
2019-06-17 12:45:34
阅读次数:
123
散点图可以显示观察数据的分布,描述数据的相关性,matlibplot也可以绘制散点图,不过我一般优先使用seaborn库的sctterplot()绘制,下面就介绍一下如何用seaborn.scatterplot()绘制散点图。 1. sctterplot()参数说明 x,y:输入的绘图数据,必须是数 ...
分类:
其他好文 时间:
2019-05-18 19:07:30
阅读次数:
427
1.HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似 ...
分类:
其他好文 时间:
2019-05-10 23:31:47
阅读次数:
210