1.Hive不存储数据,Hive需要分析计算的数据,以及计算结果后的数据实际存储在分布式系统上,如HDFS上。 2.Hive某种程度来说也不进行数据计算,只是个解释器,只是将用户需要对数据处理的逻辑,通过SQL编程提交后解释成MapReduce程序,然后将这个MR程序提交给Yarn进行调度执行。所以 ...
分类:
数据库 时间:
2019-04-12 10:29:18
阅读次数:
238
Oracle统计信息 统计信息主要是描述数据库中表,索引的大小,规模,数据分布状况等的一类信息。例如,表的行数,块数,平均每行的大小,索引的leaf blocks,索引字段的行数,不同值的大小等,都属于统计信息。CBO正是根据这些统计信息数据,计算出不同访问路径下,不同join 方式下,各种计划的成 ...
分类:
数据库 时间:
2019-04-09 16:57:29
阅读次数:
141
1. 写在前面 Flink被誉为第四代大数据计算引擎组件,即可以用作基于离线分布式计算,也可以应用于实时计算。Flink的核心是转化为流进行计算。Flink三个核心:Source,Transformation,Sink。其中Source即为Flink计算的数据源,Transformation即为进行 ...
分类:
数据库 时间:
2019-03-20 21:02:59
阅读次数:
434
之前我们提到,计算机利用数据有三种方式:1.直接使用数据,2.计算和加工数据,3.用数据做判断。 除了while循环,我之前学过的if...elif...else语句,也涉及到【利用数据用做逻辑判断】。当逻辑判断通过才会继续执行: 当然,if和while有个显著的区别。那就是if语句只会执行一次,而 ...
分类:
其他好文 时间:
2019-03-14 22:27:51
阅读次数:
228
首先说一下聚类算法,聚类算法是指对一组目标进行分类,属于同一组的目标被划分在一组中,与其他组目标相比,同一组目标更加彼此相似。聚类算法的例子有很多,比如说K-均值(k-Means)、k-Medians 算法、Expectation Maximi 封层 ation (EM)、最大期望算法(EM)、分层... ...
分类:
编程语言 时间:
2019-03-13 16:40:28
阅读次数:
229
ISO五层:应用层,传输层,网络层,数据链路层,物理层应用层:HTTP,FTP,TFTP,SMIP,SNMP,DNS等(数据)计算机传输层:tcp传输控制协议,udp用户数据协议(传输协议,端口)数据段(segment)防火墙网络层:icmp,igmp,IP,ARP,rarp(网络协议)IP数据包(packet)路由器数据链路层:由底层网络定义的协议Mac数据帧(frame)交换机物理层:比特流(
分类:
其他好文 时间:
2019-03-07 18:08:54
阅读次数:
217
1.集合 定义:集合就是一堆东西。集合里的东西,称为元素Element 数学中的集合: 有限集合: 一个班所有的学生组成的集合 一个网站所有的商品组成的集合 无限集合: 全体自然数集合 奇数集合 2.计算机中引入集合的意义 为了处理一组数据: 计算所有同学的总成绩和平均成绩 列举所有的商品 遍历页面 ...
分类:
编程语言 时间:
2019-03-05 22:53:50
阅读次数:
272
什么是计算机? 计算机(computer)俗称电脑,是现代一种用于高速计算的电子机器,可以进行数值计算,又可以进行逻辑判断,还具有存储记忆功能,且能够按照程序的运行,自动、高速处理数据。 计算机是20世纪最先进的科学技术发明之一。 计算机是由什么组成的? 一个完整的计算机系统,是由硬件系统和软件系统 ...
分类:
其他好文 时间:
2019-03-05 21:25:41
阅读次数:
173
从技术角度看现代社会的运行本质 区块链的本质 本质:数据管理+数据控制(收集数据+存储数据+管理数据+提取数据+分析数据+使用数据) 收集数据:各大应用 存储数据:数据中心,各种链(以太坊,eos等) 管理数据:节点治理 提取数据:各种链的数据计算性能 分析数据:从链上获取数据,线下用sql工具、人 ...
分类:
其他好文 时间:
2019-03-05 11:35:45
阅读次数:
234
处理器运行时要做大量的数据计算和交换,要求内存读写速度很快。 NOR Flash读取快,写入慢,总线结构,能运行代码,价格贵。 NAND Flash读取慢,写入快,非总线结构,不能运行代码,价格便宜。 SDRAM读取和写入都很快,掉电不能保存数据,价格贵。 1.SDRAM+NAND Flash 是因 ...
分类:
其他好文 时间:
2019-03-04 09:34:01
阅读次数:
180