一、大数据的计算模式在日常生活中,我们通常会先把数据存储在一张表中,然后再进行加工、分析,这里就涉及到一个时效性的问题。如果我们处理以年、月为单位的级别的数据,那么多数据的实时性要求并不高;但如果我们处理的是以天、小时,甚至分钟为单位的数据,那么对数据的时效性要求就比较高。在第二种场景下,如果我们仍旧采用传统的数据处理方式,统一收集数据,存储到数据库中,之后在进行分析,就可能无法满足时效性的要求。
分类:
其他好文 时间:
2019-09-09 21:04:16
阅读次数:
108
背景 kafka早期作为一个日志消息系统,很受运维欢迎的,配合ELK玩起来很happy,在kafka慢慢的转向流式平台的过程中,开发也慢慢介入了,一些业务系统也开始和kafka对接起来了,也还是很受大家欢迎的,由于业务需要,一部分小白也就免不了接触kafka了,这些小白总是会安奈不住好奇心,要精确的 ...
分类:
数据库 时间:
2019-09-09 11:41:56
阅读次数:
336
一.什么是套接字 套接字(socket)是计算机之前数据传输的工具,是有计算机系统提供的一个组件,是网络数据传输的软件设备。 二.TCP/IP协议 TCP/IP协议栈共分为4层(OSI规范分7层),tcp、udp就是基于socket的一种协议 三.套接字的分类 1.流式套接字(TCP) 它提供了一种 ...
分类:
其他好文 时间:
2019-09-06 17:28:38
阅读次数:
97
一、静态布局(Static Layout)即传统Web设计,网页上的所有元素的尺寸一律使用px作为单位。1、布局特点:不管浏览器尺寸具体是多少,网页布局始终按照最初写代码时的布局来显示。常规的pc的网站都是静态(定宽度)布局的,也就是设置了min-width,这样的话,如果小于这个宽度就会出现滚动条 ...
分类:
其他好文 时间:
2019-09-04 19:18:22
阅读次数:
126
1.1 什么是Spark Streaming Spark Streaming类似于Apache Storm,用于流式数据的处理。根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitt ...
分类:
其他好文 时间:
2019-09-04 10:22:15
阅读次数:
115
一.Stream数据流 从JDK1.8开始,由于已经进入到了大数据的时代,所以在类集里面也支持有数据的分析处理操作(数据的流式分析处理操作),为此就专门提供了一个Stream的接口,同时在Collection接口里面也提供有为此接口实例化的方法: 并行流式分析:default Stream<E> p ...
分类:
其他好文 时间:
2019-09-02 23:35:37
阅读次数:
126
Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成。 在 "Streaming 大数据的未来" 一文中我们知道,对于流式处理最重要的两件事,正确性,时间推理工具。而Flink对两者都有非常好的支持。 Flink对于正确性的 ...
分类:
其他好文 时间:
2019-09-02 14:01:54
阅读次数:
92
前言: 之前在学习JDK1.8的时候接触到了1.8的两个重要的新特新,一个是lambda函数式编程、另一个则是接口的变化,在这里还有一个非常重要的内容就是strema流式处理方式,在传统的java代码中,如果我们要对一个集合做一些操作,就必须遍历这个集合那个集合中的元素逐个操作,而在JDK1.8引入 ...
分类:
其他好文 时间:
2019-09-01 18:32:38
阅读次数:
128
标准文档流概念 对于文本网页的制作,是一个“流”式结构,从上到下执行。 标准文档流的特点 1、空白折叠现象 多个空格会被合并成一个空格显示到浏览器页面中。img标签换行写。会发现每张图片之间有间隙,如果在一行内写img标签,就解决了这个问题,但是我们不会这样去写我们的html结构。这种现象称为空白折 ...
分类:
其他好文 时间:
2019-08-31 15:27:20
阅读次数:
100
Kafka简介 定义 Kafka是一个分布式流式处理平台,它提供三种角色:消息系统,存储系统,流式处理平台 组成 Kafka架构体系为实现消息模块包括了若干producer,broker和consumer,还有zookeeper集群来负责元数据的管理和控制器选举等操作。 生产者 主线程创建消息Pro ...
分类:
其他好文 时间:
2019-08-29 09:56:19
阅读次数:
96