数据分析中将两个数据集进行 Join 操作是很常见的场景。在 Spark 的物理计划阶段,Spark 的 Join Selection 类会根 据 Join hints 策略、Join 表的大小、 Join 是等值 Join 还是不等值以及参与 Join 的 key 是否可以排序等条件来选择最 终的 ...
分类:
其他好文 时间:
2021-06-10 18:28:12
阅读次数:
0
转自:https://blog.csdn.net/wushuomin/article/details/80051295 1.pthread_create #include <pthread.h> int pthread_create( pthread_t *restrict tidp, //新创建的 ...
分类:
其他好文 时间:
2021-06-10 17:47:19
阅读次数:
0
tmux 确实很好用,个人建议是修改下tmux中的组合键ctrl+b。查看prefix现有绑定键: tmux show-options -g | grep prefix要在tmux内置命令中修改及时生效,可在终端中输入以下命令:tmux set -g prefix C-xtmux unbind C- ...
分类:
其他好文 时间:
2021-06-09 15:27:17
阅读次数:
0
1、什么是表分区? mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存表索引的。如果一张表的数据量太大的话,那么myd,m ...
分类:
数据库 时间:
2021-06-09 10:32:43
阅读次数:
0
volatile 作用 保证线程可见性 使用volatile,将会强制所有线程都去堆内存中读取变量的值 -MESI(CPU的缓存一致性协议) 详细可看 https://www.cnblogs.com/z00377750/p/9180644.html 禁止指令重排序(CPU级别的支持) cpu级别增加 ...
分类:
编程语言 时间:
2021-06-08 23:17:33
阅读次数:
0
一、数据来源 CSV、yaml、xml、db、excel、json 二、本质 读取数据源返回数组,然后利用参数化进行数据与变量的对应 基于schema:List<Class> 纯数据:Array<Array<String,Object>> 三、数据格式 优点 缺点 Excel 生成数据方便 二进制文 ...
分类:
其他好文 时间:
2021-06-07 21:12:07
阅读次数:
0
in 和 exists区别 in 是把外表和内表作hash join,而exists是对外表作loop,每次loop再对内表进行查询。 一直以来认为exists比in效率高的说法是不准确的。 如果查询的两个表大小相当,那么用in和exists差别不大。 如果两个表中一个较小,一个是大表,则子查询表大 ...
分类:
其他好文 时间:
2021-06-07 20:57:52
阅读次数:
0
# # Django_静态文件夹的配置 # settings文件夹配置内容 # # STATIC_URL = '/static/' #别名,引用名 为了后端的更改不会影响前端的引入,避免造成前端大量修改 # STATICFILES_DIRS = ( # os.path.join(BASE_DIR," ...
分类:
其他好文 时间:
2021-06-07 20:39:36
阅读次数:
0
概念 基于断言机制来判断输入参数后函数的输出与期望结果的是否一致。 unitest.TestCase中内置的assertXxxx方法 序号断言方法断言描述 1 assertEqual(arg1, arg2, msg=None) 验证arg1=arg2,不等则fail 2 assertNotEqual ...
分类:
其他好文 时间:
2021-06-07 20:01:02
阅读次数:
0
Domain 层 <PackageReference Include="Volo.Abp.Identity.Domain" Version="4.3.2" /> <PackageReference Include="Volo.Abp.PermissionManagement.Domain.Ident ...
分类:
数据库 时间:
2021-06-06 18:42:48
阅读次数:
0