码迷,mamicode.com
首页 >  
搜索关键字:大型数据集    ( 104个结果
协方差矩阵在图像处理之特征脸处理中的应用
【协方差矩阵在图像处理之特征脸处理中的应用】 【说】注意关键点在于“数据量的巨大,计算量的巨大”。【说】特征值起到了数据压缩、显示特征的作用。 一个标准化的面部图形的一个大型数据集合的协方差矩阵的特征向量称为特征脸。 https://zh.wikipedia.org/wiki/特征值和特征向量 在图 ...
分类:其他好文   时间:2017-09-16 20:35:43    阅读次数:187
实操 | 内存占用减少高达90%,还不用升级硬件?没错,这篇文章教你妙用Pandas轻松处理大规模数据
注:Pandas(Python Data Analysis Library) 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。此外,Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 相比较于 Numpy,Pandas 使用一个二维的数据结构 ...
分类:其他好文   时间:2017-08-19 21:21:04    阅读次数:862
Hadoop入门(一)概念
一、hadoop的概念 (1)什么是大数据 大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。 (2)hadoop的定义 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Hadoop的框架最核心的设计就是:HDFS和M ...
分类:其他好文   时间:2017-08-18 11:16:57    阅读次数:191
pandas介绍及环境部署
pandas介绍 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函 ...
分类:其他好文   时间:2017-07-15 16:00:06    阅读次数:185
MapReduce编程实战之“高级特性”
本篇介绍MapReduce的一些高级特性,如计数器、数据集的排序和连接。计数器是一种收集作业统计信息的有效手段。排序是MapReduce的核心技术,MapReduce也可以运行大型数据集间的“”连接(join)操作。 计数器 计数器是一种收集作业统计信息的有效手段,用于质量控制或应用级统计。计数器还 ...
分类:其他好文   时间:2017-07-05 13:32:09    阅读次数:138
Ng第十七课:大规模机器学习(Large Scale Machine Learning)
17.1 大型数据集的学习 17.2 随机梯度下降法 17.3 微型批量梯度下降 17.4 随机梯度下降收敛 17.5 在线学习 17.6 映射化简和数据并行 17.1 大型数据集的学习 17.2 随机梯度下降法 17.3 微型批量梯度下降 17.4 随机梯度下降收敛 17.5 在线学习 17.6 ...
分类:系统相关   时间:2017-05-14 10:37:02    阅读次数:363
Python之关于工具包简介
1、Pandas Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函 ...
分类:编程语言   时间:2017-05-06 20:02:59    阅读次数:150
Spark学习笔记——Spark上数据的获取、处理和准备
数据获得的方式多种多样,常用的公开数据集包括: 1.UCL机器学习知识库:包括近300个不同大小和类型的数据集,可用于分类、回归、聚类和推荐系统任务。数据集列表位于:http://archive.ics.uci.edu/ml/ 2.Amazon AWS公开数据集:包含的通常是大型数据集,可通过Ama ...
分类:其他好文   时间:2017-04-29 12:57:42    阅读次数:198
pandas 的数据结构(Series, DataFrame)
Pandas 讲解 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 pandas提供了大量能使我们快速便捷地处理数 ...
分类:其他好文   时间:2017-02-20 16:43:35    阅读次数:1177
【IT十八掌大数据】学习笔记
hive简介: 0.big data的特点:4 Volumn variety velocity value 1.介绍 数据仓库 //online analyze process,在线分析处理。 用来查询和管理位于分布式存储设备上的大型数据集。 Hive提供了一种类SQL语言--HiveQL(HQL) ...
分类:其他好文   时间:2017-02-09 23:52:27    阅读次数:640
104条   上一页 1 ... 6 7 8 9 10 11 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!