一、impala基本介绍? 所有的计算都是基于内存来的,官方推荐每台服务器的内存最少128G起 impala是cloudera提供的一款高效率的sql查询工具,提供实时的查询效果,官方测试性能比hive块3到10倍,其sql查询比sparkSQL还要快,号称是当前大数据领域最快的查询sql工具。 i ...
分类:
其他好文 时间:
2020-04-04 18:48:40
阅读次数:
81
一、什么是Presto? 背景知识:Hive的缺点和Presto的背景 Hive使用MapReduce作为底层计算框架,是专为批处理设计的。但随着数据越来越多,使用Hive进行一个简单的数据查询可能要花费几分到几小时,显然不能满足交互式查询的需求。Presto是一个分布式SQL查询引擎,它被设计为用 ...
分类:
其他好文 时间:
2020-04-04 11:41:05
阅读次数:
80
这是有空头的链表 #include"stdio.h" #include"stdlib.h" #include"windows.h" struct Node { int a; struct Node* pNEXT; }; //链表头尾指针定义 struct Node* g_pHead = NULL; ...
分类:
编程语言 时间:
2020-04-04 00:01:19
阅读次数:
91
1开头的http状态码表示临时响应并需要请求者继续执行操作的状态代码。100 (继续) 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。 101 (切换协议) 请求者已要求服务器切换协议,服务器已确认并准备切换。 2开头的http状态码表示请求成功200 成功处 ...
分类:
Web程序 时间:
2020-04-02 22:26:33
阅读次数:
126
编写一个 SQL 查询,查找所有至少连续出现三次的数字。 + + +| Id | Num |+ + +| 1 | 1 || 2 | 1 || 3 | 1 || 4 | 2 || 5 | 1 || 6 | 2 || 7 | 2 |+ + +例如,给定上面的 Logs 表, 1 是唯一连续出现至少三次的 ...
分类:
数据库 时间:
2020-04-02 16:19:20
阅读次数:
210
导读:能单独拎出SQL文件的某一行或几行执行,是不是非常有趣?今天我们来介绍一下这个有意思的库 dotsql。 背景介绍 dotsql不是ORM,也不是SQL查询语句的构建器,而是可以在一个SQL文件中拎出某几行来执行的工具,非常类似于ini配置文件的读取。如果还不理解,我们来看如下内容。 上面是S ...
分类:
数据库 时间:
2020-04-02 16:19:04
阅读次数:
140
第一部分:手工备份与恢复 备份的意义:保证数据安全,避免因为各种故障而丢失数据 两个时间:平均故障间隔时间(MTBF)平均恢复时间(MTTR) 一、备份恢复概述 数据库故障类型 1.用户进程故障 user process failure :pmon自动处理 2.实例故障 instance failu ...
分类:
数据库 时间:
2020-04-02 16:15:24
阅读次数:
140
场景:关联查询,一张主表关联4张表进行查询。主表数据量是16万,其中被关联的一张表的数量是6万。 遇到页面响应速度过慢的情况,首先考虑是否是sql查询缓慢引起的。 第一步开启mysql的慢查询日志(网上教程很多,本篇文章不再赘述) 第二步分析慢查询日志,这里要说下分析工具。常用的有两种,一是mysq ...
分类:
数据库 时间:
2020-04-02 16:09:21
阅读次数:
78
示例中 mysql字段类型为 datetime 使用到mysql函数 DATE_SUB() 和 now() 示例1: <!-- 更新5天前的订单 审核中-6 改成 审核失败-81 create_time <= DATE_SUB(now(), INTERVAL 5 DAY) 5天前,精确到秒 --> ...
分类:
数据库 时间:
2020-04-02 15:57:29
阅读次数:
617
一:什么是SparkSQL? (一)SparkSQL简介 Spark SQL是Spark的一个模块,用于处理结构化的数据,它提供了一个数据抽象DataFrame(最核心的编程抽象就是DataFrame),并且SparkSQL作为分布式SQL查询引擎。Spark SQL就是将SQL转换成一个任务,提交 ...
分类:
数据库 时间:
2020-04-02 15:36:01
阅读次数:
88