直通BAT之JVM系列 直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结 直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置 今天继续JVM的垃圾回收器详解,如果说垃圾收集算法是JVM内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。 常见的垃圾收集器有3类: ...
分类:
其他好文 时间:
2020-05-07 13:15:58
阅读次数:
69
NoSQL的四大种类 NoSQL数据库在整个数据库领域的江湖地位已经不言而喻。在大数据时代,虽然RDBMS很优秀,但是面对快速增长的数据规模和日渐复杂的数据模型,RDBMS渐渐力不从心,无法应对很多数据库处理任务,这时NoSQL凭借易扩展、大数据量和高性能以及灵活的数据模型成功的在数据库领域站稳了脚 ...
分类:
数据库 时间:
2020-05-06 12:12:17
阅读次数:
86
最近在研究数据结构与算法,在B站中找到了小甲鱼的《数据结构与算法课程》,挺有意思的! (小甲鱼)数据结构和算法 对于一个算法来说,分析有两步,第一是从数学上证明算法的正确性,第二步是分析算法的时间复杂度。 算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能反映出算法的优劣与 ...
分类:
编程语言 时间:
2020-05-05 01:09:23
阅读次数:
92
背景 作为中国最大的在线教育站点,目前沪江日志服务的用户包含网校,交易,金融,CCTalk 等多个部门的多个产品的日志搜索分析业务,每日产生的各类日志有好十几种,每天处理约10亿条(1TB)日志,热数据保留最近7天数据,冷数据永久保存。 为什么做日志系统 首先,什么是日志? 日志就是程序产生的,遵循 ...
分类:
其他好文 时间:
2020-04-29 10:30:59
阅读次数:
96
这一章学习了栈和队列的相关知识,了解了栈和队列的定义、顺序栈、链栈、顺序队、链队如何表示和操作以及这几种结构在不同情况下的优劣,还有递归算法的原理和应用,更深入的学习了数据结构。在对顺序结构和链式结构有了一定的了解后,这一章的内容更好理解了,很快就明白了栈和队列是如何实现的,比如队列 1 typed ...
分类:
其他好文 时间:
2020-04-26 19:15:12
阅读次数:
69
算法(Algorithm)是指用来操作数据、解决程序问题的一组方法。对于同一个问题,使用不同的算法,也许最终得到的结果是一样的,但在过程中消耗的资源和时间却会有很大的区别。 那么我们应该如何去衡量不同算法之间的优劣呢? 主要还是从算法所占用的「时间」和「空间」两个维度去考量。 时间维度:是指执行当前 ...
分类:
编程语言 时间:
2020-04-24 14:40:29
阅读次数:
86
浅谈软件体系架构质量属性 刘晓杰 石家庄铁道大学 河北省石家庄市 摘 要:本文通过针对淘宝网操作流程的举例,阿里云服务器特点来进行简单阐述,简述了软件质量属性六大指标中的性能以及判断软件性能的优劣以及提高性能的方法, 关键词:性能,淘宝网,性能,阿里云服务器 Abstract:In this pap ...
分类:
其他好文 时间:
2020-04-23 00:35:29
阅读次数:
69
在介绍算法的时间复杂度基本概念和计算方法后,给出几个常用控制结构的时间复杂度。 ...
分类:
编程语言 时间:
2020-04-17 21:43:42
阅读次数:
73
通用爬虫和聚焦爬虫根据使用场景,网络爬虫可分为通用爬虫和聚焦爬虫两种.通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。通用网络爬虫从互联网中搜集网页,采集信息,这些网页信息用于为搜索引擎建立索引从而提供支持,它决定着整个引擎系统的内容是否丰富,信息是否即时,因此其性能的优劣直接影响着搜索引擎
分类:
编程语言 时间:
2020-04-13 22:44:50
阅读次数:
125
[TOC] 在开始介绍 scrapy 的去重之前,先想想我们是怎么对 requests 对去重的。 requests 只是下载器,本身并没有提供去重功能。所以我们需要自己去做。 很典型的做法是事先定义一个去重队列,判断抓取的 url 是否在其中,如 此时的集合是保存在内存中的,随着爬虫抓取内容变多, ...
分类:
其他好文 时间:
2020-04-12 18:36:57
阅读次数:
69