名称 大二暑假学习总结二 所花时间 25h左右 有效代码量 2500行左右 博客量 5篇 收获和目标 收获: 1、python语法、函数、正则等 2、爬虫的相关学习,完成了5个有关爬虫的项目实战 3、大数据相关环境的安装以及配置,包括:VMware、Centos、 finalshell等 目标: p ...
分类:
其他好文 时间:
2020-08-10 14:30:35
阅读次数:
70
直接插入排序 一般来说,插入排序都采用in-place在数组上实现。具体算法描述如下: 从第一个元素开始,该元素可以认为已经被排序 取出下一个元素,在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新 ...
分类:
编程语言 时间:
2020-08-10 13:13:59
阅读次数:
60
在虚拟机上进行用户的增加: 以及相应的其他命令的设置: ...
分类:
其他好文 时间:
2020-08-09 21:34:32
阅读次数:
98
public class demo2 { public static void main(String[] args) { //八大数据类型 //整数 int num1 = 10; //最常用 -2147483648-2147483647 占4个字节 byte num2 = 100; //-128- ...
分类:
其他好文 时间:
2020-08-08 17:37:55
阅读次数:
66
SQL是大数据从业者的必备技能,大部分的大数据技术框架也都提供了SQL的解决方案。可以说SQL是一种经久不衰、历久弥新的编程语言。尤其是在数仓领域,使用SQL更是家常便饭。本文会分享四个在面试和工作中常用的几个使用技巧,具体包括:日期与期间的使用临时表与CommonTableExpression(WITH)Aggregation与CASEWHEN的结合使用WindowFunction的其他用途数仓
分类:
数据库 时间:
2020-08-08 00:41:54
阅读次数:
95
写在前面 最近不少读者找我要大数据面试题,我整理了很久,筛选出这10道容易出错的大数据面试题,希望对大家有所帮助。题目与解答整理自互联网,感谢分享这些面经的技术大牛们! 题目概览 如何从大量的 URL 中找出相同的 URL?(百度) 如何按照 query 的频度排序?(百度) 如何统计不同电话号码的 ...
分类:
其他好文 时间:
2020-08-08 00:32:59
阅读次数:
53
ForkJoin :: 分支合并 (JDK 1.7) 并行执行任务,提高效率。 使用场景:大数据量 将大任务拆成小任务 ForkJoin 特点:工作窃取 这个里面维护的都是双端队列,如果一方执行完了,获取另外一方的未完成的任务进行执行 ForkJoin 的操作 package pers.vincen ...
分类:
其他好文 时间:
2020-08-07 12:33:23
阅读次数:
64
作者:bellen,腾讯云大数据研发工程师。腾讯云Elasticsearch被广泛应用于日志实时分析、结构化数据分析、全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与方法,希望与大家一同交流。背景因为游戏业务本身的日志数据量非常大(写入峰值在100wqps),在服务客户的几个月中,踩了不少坑,经过数次优化与调整,把客户的ES集群调整
分类:
其他好文 时间:
2020-08-07 10:02:01
阅读次数:
67