一、 org.apache.nutch.crawl.Injector 注入url.txt url标准化 拦截url,进行正则校验(regex-urlfilter.txt) 对符合URL标准的url进行map对构造,在构造过程中给CrawlDatum初始化得分,分数可影响url host的搜索排序和采 ...
分类:
其他好文 时间:
2016-06-07 14:39:50
阅读次数:
198
读一下underscore源代码,用于自己学习,个人理解,如果有不对的地方希望指正,谢谢 我觉着阅读的顺序按照从整体到局部,从架构到细节较好。 1.整体架构 (function() {}.call(this)); 整个源代码就是使用全局变量this作为调用方执行一个匿名自执行函数,目的就是防止全局对 ...
分类:
其他好文 时间:
2016-05-17 17:55:53
阅读次数:
169
基于log4j1.2.17的源代码阅读 org.apache.log4j.xml.DOMConfigurator 类是log4j的xml配置文件初始化类 org.apache.log4j.PropertyConfigurator 类是log4j的properties形式配置文件的初始化类 今天看的是
分类:
其他好文 时间:
2016-02-02 15:00:54
阅读次数:
176
Eclipse源代码分析一、概述走入Eclipse的内核,看看它到底是怎么工作的?1、Eclipse源代码下载地址:http://download.eclipse.org/eclipse/downloads2、源代码阅读工具 Source Insight V3.5它其实是一个代码编辑软件,因为有强大...
分类:
系统相关 时间:
2016-01-21 18:32:08
阅读次数:
221
阅读源代码有许多益处。你会发现新的架构(construct)和库,与其他的代码维护者产生共鸣,但最重要的是学会如何组织代码,避免因内部极其复杂而变得不可维护。但是也有一个不好的地方,那就是阅读源代码太困难了。每当我看到一个新的代码库(code base)时,这种让人眩晕的感觉就充斥了我的大脑。我的内心告诉我压根不想趟眼前这趟浑水。这是(希望是)正常的反应。当我们的大脑接触过多的新东西,就会产生排斥...
分类:
其他好文 时间:
2015-12-01 10:59:29
阅读次数:
157
EnumMap是一个用于存放键值为enum类型的map。全部的键值必须来自一个单一的enum类型。EnumMap内部用数组表示效率更高。EnumMap维持键值的自然顺序(即枚举类型常量声明的顺序),能够通过keySet()和entrySet()方法的集合视图来体现其顺序。集合视图返回的迭代器是弱一致...
分类:
编程语言 时间:
2015-09-13 08:16:40
阅读次数:
292
正确的学习方法不仅能够让你事半功倍,也能够让你更加接近真理。初学一个工程的源代码,往往让初学者手足无措。下面的方法希望为初学者带来启示和便利。这个学习方式是基于编译环境和语言比较熟悉的基础上。最重要的是你要确定你要阅读的源代码是一份好代码。因为阅读代码就像阅读书籍。好代码让你终生受益,坏代码会给你留...
分类:
其他好文 时间:
2015-09-09 19:21:17
阅读次数:
214
本文总结业务系统的源代码阅读方法。数据是业务系统的核心。规则是业务系统的外延。“数据+规则” 构成了业务系统的整体视图。 技术上主要是数据架构设计、并发控制、事务管理和系统中间件。
分类:
其他好文 时间:
2015-08-17 21:08:57
阅读次数:
152
在你开始看代码。的第一件事要做的就是下载代码。这里:https://github.com/spring-projects/spring-framework下载完整的使用发现gradle建立管理工具做源。值得庆幸的事情,spring为导入eclipse写了脚本工具,包解压后结构例如以下:waterma...
分类:
编程语言 时间:
2015-08-13 12:03:14
阅读次数:
149
本篇我们将来分析一下Tomcat中所涉及到设计模式,本文我们将主要来分析外观模式,观察者模式,责任链模式,模板方法模式,命令模式。
在开始本文之前,笔者先说明一下对于设计模式的一点看法。笔者曾经经常看到网上有人讨论设计模式,也偶尔会遇到有人非要严格按照GOF设计模式的类图以及其中的角色去套用别人的设计,只要类图不一样,或者角色多了或者少了就会觉得怎么和官方定义的模式不一样,其实这都是对设计模式...
分类:
其他好文 时间:
2015-08-11 21:26:07
阅读次数:
197