码迷,mamicode.com
首页 >  
搜索关键字:大数据集    ( 238个结果
python迭代器,生成器,装饰器
迭代器iteration 是访问集合元素的一种方式,只能往前不能往后迭代器的特点:1,访问者不需要关注迭代器内部结构,只需通过next()不断取下一个内容2,访问不能回退3,循环较大数据集合时,省内存4,不能随机访问集合中的某一个值 iter()生成迭代器__next__()访问迭代器,可以迭代生成 ...
分类:编程语言   时间:2016-08-05 16:00:29    阅读次数:177
数据可视化图表详解(二)
1.柱状图 适用场景:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。 优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。劣势:柱状图的局限在于只适用中小规模的数据集。 2折线图 折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。它还适合多 ...
分类:其他好文   时间:2016-08-05 15:43:28    阅读次数:184
sql 查询强制使用HASH连接性能测试比较
HASH JOIN 散列连接 hash join是CBO 做大数据集连接时的常用方式。优化器扫描小表(或数据源),利用连接键(也就是根据连接字段计算hash 值)在内存中建立hash表,然后扫描大表,每读到一条记录就来探测hash表一次,找出与hash表匹配的行。当小表可以全部放入内存中,其成本接近 ...
分类:数据库   时间:2016-07-21 12:28:48    阅读次数:201
Hadoop集群(第9期)_MapReduce初级案例
1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。 1.1 实例描述 对数据文件中的数据进行去重。数据文件中的每行都是一个数据。 ...
分类:其他好文   时间:2016-06-27 10:20:57    阅读次数:139
地铁译:Spark for python developers ---Spark处理后的数据可视化
数据可视化能够提取数据的结论见解和趋势。快速浏览Python 生态系统中的可视化工具,重点把Bokeh 作为渲染和展示大数据集的强劲工具。 Bokeh 是Python  Anaconda  生态系统的一部分.........
分类:编程语言   时间:2016-06-25 21:47:22    阅读次数:414
Ambari管理的大数据集群主节点内存扩容操作步骤说明
1、 关闭主机添加内存 登录指定主机系统(按表二依次操作),切换至root用户,输入poweroff命令关闭系统,待系统关闭后,由IT负责人进行内存扩容。 2、 开机检查内存信息 由IT负责人检查扩容主机的内存信息,确定内存扩容完成后再进入系统。 3、 登录系统启动服务 登录系统,切换至root用户 ...
分类:其他好文   时间:2016-06-14 19:10:24    阅读次数:1805
MemSQL 取代 HDFS 与 Spark 结合,性能大幅提升
pache Spark是目前非常强大的分布式计算框架。其简单易懂的计算框架使得我们很容易理解。虽然Spark是在操作大数据集上很有优势,但是它仍然需要将数据持久化存储,HDFS... ...
分类:数据库   时间:2016-06-08 06:56:03    阅读次数:362
【Android】RecyclerView详解(一)
1.介绍RecyclerView是比 ListView 更高级且更具灵活性的组件。 此组件是一个用于显示庞大数据集的容器,可通过保持有限数量的视图进行非常有效的滚动操作。 如果您有数据集合,其中的元素将因用户操作或网络事件而发生改变,请使用 RecyclerView 小组件。RecyclerView使用起来很方便因为它: 提供了一种插拔式的体验,高度的解耦,异常的灵活使用;...
分类:移动开发   时间:2016-06-01 23:17:40    阅读次数:774
HBase集成Zookeeper集群部署
大数据集群为了保证故障转移,一般通过zookeeper来整体协调管理,当节点数大于等于6个时推荐使用,接下来描述一下Hbase集群部署在zookeeper上的过程: 安装Hbase之前首先系统应该做通用的集群环境准备工作,这些是必须的: 1、集群中主机名必须正确配置,最好有实际意义;并且主机名都在h ...
分类:其他好文   时间:2016-05-25 12:57:26    阅读次数:195
C语言生成随机可逆方阵
1.前言 最近做并行计算作业的时候有一道题是让用并行的方式对一个矩阵求逆,这个实验的大致步骤是将一个写好的矩阵文件(一定格式)作为输入,使用一定的算法求出逆矩阵后再以文件的形式输出。因为在使用并行方式进行数值计算时,如果数据规模不够大,将很难体现并行方式的优越性,因此,拥有一个规模较大数据集就成为了这个实验成功的关键点之一。 关于数据集这件事儿,大神们纷纷使用MATLAB造出了随机二维数组文件...
分类:编程语言   时间:2016-05-24 06:59:02    阅读次数:266
238条   上一页 1 ... 14 15 16 17 18 ... 24 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!