原文:http://blog.chinaunix.net/uid-10289334-id-3758310.html 基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选择的聚点不一定是聚类中的一个点 ...
分类:
编程语言 时间:
2020-07-01 16:16:44
阅读次数:
76
Redis分布式锁 什么是分布式锁? 分布式CAP原则告诉我们,Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可得兼。 在单机(单进程)环境中,JAVA提供了很多并发相关API,但在多机(多进程)环境中就无能为力了 ...
分类:
其他好文 时间:
2020-06-30 20:21:44
阅读次数:
47
分区的原因 方便在集群中扩展 可以提高并发 生产者分区原则 有partition,直接用 有key,用key.hash%partition.length 无,随机生成整数M,用n*M%partition.length ProducerRecord(String topic,int partition ...
分类:
其他好文 时间:
2020-06-30 13:06:23
阅读次数:
51
一. 建表,导数据 1. 创建库 create database gmall; 2. 创建表start_log,ods层表 drop table if exists ods_start_log; CREATE EXTERNAL TABLE ods_start_log (`line` string) ...
分类:
其他好文 时间:
2020-06-29 15:46:05
阅读次数:
62
NoSql 数据存储-Redis CAP CAP原则又称CAP定理,指的是在一个分布式系统中,一致性(Consistency)、高可用性(Availability)、分区容错性(Partition tolerance)。CAP 原则指的是,这三个要素最多只能同时实现两点,不可能三者兼顾。 比如在我们 ...
分类:
其他好文 时间:
2020-06-26 20:37:45
阅读次数:
53
1. order by,sort by,distribute by,cluster by的区别? 2. 聚合函数是否可以写在order by后面,为什么? 需求催生技术进步 一、课前准备 二、课堂主题 三、课堂目标 1. 掌握hive表的数据压缩和文件存储格式 2. 掌握hive的JDBC代码操作 ...
分类:
其他好文 时间:
2020-06-26 18:42:15
阅读次数:
58
ROW_NUMBER() OVER(PARTITION BY ... ORDER BY ...)RANK() OVER(PARTITION BY ... ORDER BY ...)DENSE_RANK() OVER(PARTITION BY ... ORDER BY ...)COUNT() OVER ...
分类:
其他好文 时间:
2020-06-26 13:07:50
阅读次数:
87
开窗函数的理解参见: 理解hive中的开窗函数 over()中除了可以使用partition by选择分组字段外, 还有以下函数 order by 排序 指定聚合行的范围, 配合order by使用 current row: 当前行 n PRECEDING: 往前 n 行数据 n FOLLOWING... ...
分类:
其他好文 时间:
2020-06-25 21:54:18
阅读次数:
76
题目一: 我们有如下的用户访问数据 userId visitDate visitCount u01 2017/1/21 5 u02 2017/1/23 6 u03 2017/1/22 8 u04 2017/1/20 3 u01 2017/1/23 6 u01 2017/2/21 8 u02 2017 ...
分类:
其他好文 时间:
2020-06-25 21:23:41
阅读次数:
87
快速排序: void QuickSort(vector<int>& nums, int lo, int hi){ if(lo < hi){ int p = partition(nums,lo,hi); QuickSort(nums,lo,p-1); QuickSort(nums,p+1,hi); } ...
分类:
编程语言 时间:
2020-06-24 21:26:07
阅读次数:
53