说到爬虫,使用Java本身自带的URLConnection可以实现一些基本的抓取页面的功能,但是对于一些比较高级的功能,比如重定向的处理,HTML标记的去除,仅仅使用URLConnection还是不够的。在这里我们可以使用HttpClient这个第三方jar包。接下来我们使用HttpClient简单...
分类:
编程语言 时间:
2016-01-17 16:10:47
阅读次数:
276
1.FreeMarker模板文件主要由如下4个部分组成: 1.1文本:直接输出的部分 1.2注释:格式部分,不会输出 1.3插值:即${...}或#{...}格式的部分,将使用数据模型中的部分替代输出 1.4FTL指令:FreeMarker指定,和HTML标记类似,名字前加#予以区分,不会输出2.概...
分类:
其他好文 时间:
2015-12-31 19:02:20
阅读次数:
150
1.HTML文档结构 (1)html标记 这两个标签说明了html网页文件的范围,html内部的标记都在和之间。 (2)head标记 是html文件的投标及,作用是放置HTML文件的信息。如定义CSS样式代码可以放在标记之中 (3)标记 标记为标题标记。 (4)标记 是HTML页面的主题标记。页面中...
分类:
Web程序 时间:
2015-12-22 22:37:40
阅读次数:
688
(1)^[ \t]*\n这个正则表达式代表所有的空行,指含有零个或零个以上空格或制表符、以换行符结尾、不含其它字符的行。(2)(^|(?]*>.*?|匹配HTML标记的正则表达式。评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力(10)^\s*|\s*$匹配首尾....
分类:
其他好文 时间:
2015-12-21 17:54:26
阅读次数:
142
Label 辅助方法返回一个 元素,并使用 String 类型的参数来决定渲染的文本和 for 特性值。调用 Html.Label("GenreId")会生成如下 HTML 标记Genrelabel 的作用就是为其他输入元素显示附加信息。如果用户单击 label,浏览器会把焦点传送给相关的输入控件 ...
分类:
Web程序 时间:
2015-12-11 13:09:48
阅读次数:
151
DTcms.Common\Utils.cs #region 清除HTML标记 public static string DropHTML(string Htmlstring)中的 Htmlstring.Replace("", ""); Htmlstr...
分类:
其他好文 时间:
2015-12-10 18:45:14
阅读次数:
115
获得和设置内容:text( )、html( ) 以及 val( )text( ) - 设置或返回所选元素的文本内容html( ) - 设置或返回所选元素的内容(包括 HTML 标记)val( ) - 设置或返回表单字段的值例子:$("#btn1").click(function(){ $("#tes...
分类:
Web程序 时间:
2015-12-02 06:33:56
阅读次数:
161
text() - 设置或返回所选元素的文本内容html() - 设置或返回所选元素的内容(包括 HTML 标记)val() - 设置或返回表单字段的值下面的例子演示如何通过 text()、html() 以及 val() 方法来设置内容:实例$("#btn1").click(function(){ ....
分类:
Web程序 时间:
2015-11-30 19:53:22
阅读次数:
111
1、HTML 标记与文档结构1.1 块级(block)和行内(inline)标签块级标签- : 6级标签,h1表示最重要(h1 不仅仅是最大最突出的标题,搜索引擎也将其视为仅次于 标签的另一个搜索关键词的来源): 段落: 有序列表: 列表项: 独立引用行内标签: 连接(anchor,锚): 图片: ...
分类:
Web程序 时间:
2015-11-26 15:07:02
阅读次数:
165
以下是引用片段: -----/**//// /// 去除HTML标记/// /// 包括HTML的源码 /// 已经去除后的文字public static string NoHTML(string Htmlstring){//删除脚本Htmlstring = Regex.Replace(Htmls....
分类:
Web程序 时间:
2015-11-19 18:55:50
阅读次数:
204