码迷,mamicode.com
首页 >  
搜索关键字:graph partition    ( 6460个结果
ods_to_dwd_sql
主要是这两个sql start_log(利用get_json_object函数): insert overwrite table "$app".dwd_start_log PARTITION (dt='$do_date') select get_json_object(line,'$.mid') m ...
分类:数据库   时间:2021-02-23 14:36:54    阅读次数:0
[Spark] pyspark insertInto 去重插入数据表
pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...
分类:其他好文   时间:2021-02-23 14:14:20    阅读次数:0
MapReduce基本原理
在围绕Hadoop形成的大数据技术生态当中,MapReduce的地位,在早期是处于核心地位的,但是伴随着数据处理实时性需求的不断提升,更多新的计算框架出现,MapReduce的地位受到压制,但是作为Hadoop原始计算框架,还是需要相应程度的了解和掌握的。今天的大数据入门分享,我们来具体讲一讲Map ...
分类:其他好文   时间:2021-02-09 12:33:28    阅读次数:0
【论文阅读】Document-level Relation Extraction with Dual-tier Heterogeneous Graph[COLING2020]
论文地址:https://www.aclweb.org/anthology/2020.coling-main.143/ 代码地址:未找到 Abstract 本文提出了一种新的基于双层异构图(DHG)的文档级RE模型。特别是,DHG由结构建模层和关系推理层组成Composed of a structu ...
分类:其他好文   时间:2021-02-09 12:03:52    阅读次数:0
Oracle rownum和row_number()
rownum 和 row_number()的区别 一、 Oracle中的rownum 用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依次类推。这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀。 rownum对于等于某值的查询条件 如果希望找到学生表中 ...
分类:数据库   时间:2021-02-08 12:51:03    阅读次数:0
C# list sort底层原理
如果提供比较,则使用委托表示的方法对列表中的元素进行排序。如果comparison为null,则抛出ArgumentNullException。 此方法使用数组.排序,其应用自省排序,如下所示: 如果分区大小小于或等于16个元素,则使用插入排序算法 如果分区数超过2logn,其中n是输入数组的范围, ...
分类:Windows程序   时间:2021-02-08 12:14:42    阅读次数:0
Go 环境变量设置
export GOPATH=~/go_workspaces/mainexport GOBIN=$GOPATH/binPATH=$PATH:$GOPATH:$GOBINexport PATH ...
分类:其他好文   时间:2021-02-03 10:45:09    阅读次数:0
Fast DFS
单点上传文件 原先来的单点上传文件就是在同一个系统内上传 graph LR A(图片系统) -->B[图片服务器] C(支付系统) -->D[支付服务器] E(后台系统) -->F[后台服务器] 使用FastDFS分布式文件上传 FastDFS:使用C语音编写的一款分布式文件系统,FastDFS充分 ...
分类:其他好文   时间:2021-02-03 10:30:31    阅读次数:0
Spark executor中task的数量与最大并发数
每个task处理一个partition,一个文件的大小/128M就是task的数量 Task的最大并发数 当task被提交到executor之后,会根据executor可用的cpu核数,决定一个executor中最多同时运行多少个task。 默认情况下一个task对应cpu的一个核。如果一个exec ...
分类:其他好文   时间:2021-02-02 11:14:58    阅读次数:0
Spark面试常见问题(一)--RDD基础
1 RDD基础知识 1.1 Spark的RDD五大特性 1.1.1 A list of partitions RDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的List;将数据加载为RDD时,一般一个hdfs里的block会加载为一个partition。 对于RDD来说,每 ...
分类:其他好文   时间:2021-01-25 11:30:09    阅读次数:0
6460条   上一页 1 ... 4 5 6 7 8 ... 646 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!