搜索关键字：大数据处理，搜索到465个结果！码迷,mamicode.com！

Spark(一): 基本架构及原理

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一，与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark有如下优势： Spark提供了一个全面、统 ...

分类：其他好文时间：2019-10-02 00:18:24 阅读次数：145

深入理解Flink核心技术及原理

前言 Apache Flink（下简称Flink）项目是大数据处理领域最近冉冉升起的一颗新星，其不同于其他大数据项目的诸多特性吸引了越来越多人的关注。本文将深入分析Flink的一些关键技术与特性，希望能够帮助读者对Flink有更加深入的了解，对其他大数据系统开发者也能有所裨益。本文假设读者已对Map ...

分类：其他好文时间：2019-09-16 00:08:39 阅读次数：81

什么是流式计算？

一、大数据的计算模式在日常生活中，我们通常会先把数据存储在一张表中，然后再进行加工、分析，这里就涉及到一个时效性的问题。如果我们处理以年、月为单位的级别的数据，那么多数据的实时性要求并不高；但如果我们处理的是以天、小时，甚至分钟为单位的数据，那么对数据的时效性要求就比较高。在第二种场景下，如果我们仍旧采用传统的数据处理方式，统一收集数据，存储到数据库中，之后在进行分析，就可能无法满足时效性的要求。

分类：其他好文时间：2019-09-09 21:04:16 阅读次数：108

[个推 CTO、前MSN中国首席架构师谈数据智能] 之本质及技术体系要求

安森，个推CTO毕业于浙江大学，现全面负责个推技术选型、研发创新、运维管理等工作，已带领团队开发出针对移动互联网、金融风控等行业的多项前沿数据智能解决方案。曾任MSN中国首席架构师，拥有十余年资深技术开发与项目管理经验，在大数据处理系统、大规模并发平台、分布搜索系统、手机应用开发、无线通信领域和智慧金融系统等领域拥有丰富实践经验。引言中国移动互联网的发展见证了中国大数据行业的蓬勃发展。数据智能作为

分类：其他好文时间：2019-08-08 00:24:57 阅读次数：107

行存储 VS 列存储

概述目前大数据存储有两种方案可供选择：行存储（Row-Based）和列存储（Column-Based）。业界对两种存储方案有很多争持，集中焦点是:谁能够更有效地处理海量数据，且兼顾安全、可靠、完整性。从目前发展情况看，关系数据库已经不适应这种巨大的存储量和计算要求，基本是淘汰出局。在已知的几种大数... ...

分类：其他好文时间：2019-08-07 17:39:20 阅读次数：143

大数据是啥，可以吃的吗？

作者|影姿关于大数据是什么，从一开始仅仅只想做数据，到开始意识到自己做的是对整个集团有核心意义的数据产品，再到走到外面，把数据能力对外输出，所有过程中，不断的有客户问到这个问题，有懵懂的、有善意的、也有挑衅的、不屑的。就像大数据本身一样，混乱又带有迷幻色彩。现在对大数据的理解有两种极端：站在大数据的风口，很多人觉得大数据是未来，可以解决所有问题，包括人工智能；我自己不用想，大数据已经替我想好决定好

分类：其他好文时间：2019-07-23 13:39:36 阅读次数：115

大数据能做什么,为什么学习大数据

Hadoop和大数据是这两年最火的词儿们之一，越来越多的公司对这个东西感兴趣，但是我接触到的大多数公司里的人，无论是技术人员还是老板。都不知道怎么能把这些东西用于改善自己公司的业务。在解答的过程中，提炼出几个要点，记录一下。大数据和云是不是一回事？这是最容易混淆的概念之一，我个人认为这是两回事，云服务，无论是云主机还是云存储还是云的其他应用，都是向用户提供一个接口，但这个接口的后端是虚拟机技术，或

分类：其他好文时间：2019-07-10 14:49:09 阅读次数：116

apache storm基本原理及使用总结

什么是Apache Storm Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架，具有最高的摄取率。虽然Storm是无状态的，它通过Apache ZooKeeper管理分布式环境和集群状态。通过Storm可以并行地对实 ...

分类：Web程序时间：2019-07-07 14:55:25 阅读次数：186

阿里面试深度学习[转]

我有过阿里、腾讯、滴滴、宜信等等的面试经历，这是我死的最惨的一次，腾讯排第二。如下问题： 1.你觉得大数据生态圈从技术角度来看，未来会朝什么方向发展？ 1.2.大数据处理的时候为什么选择spark而不是hadoop 答：1.spark是内存计算的，而hadoop是磁盘计算的，所以spark比had ...

分类：其他好文时间：2019-07-07 12:58:51 阅读次数：287

大数据学习路线

一、大数据处理流程 1.1 数据收集 1.2 数据存储 &n ...

分类：其他好文时间：2019-07-04 17:33:35 阅读次数：133

共465条上一页 1 ... 4 5 6 7 8 ... 47 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)