码迷,mamicode.com
首页 >  
搜索关键字:jsoup    ( 471个结果
使用Tika、Luke工具解析多种类型(word、pdf、txt 等)索引文件
Tika 是2008年才产生的apache的一个项目,主要用于打开各种不同类型的文档,获取其文本信息。可以解析多种类型(word、pdf、txt 、html等)文件! 甚至可以通过解析url,获取其网页信息。最后把其文本信息提起出来。这方面Tika有点像Jsoup。。一般情况下,直接对word、pdf等文件直接创建索引是不对的,用luke工具查看之后,出现一大推乱七八糟的term。这个时候就可以用Tika 去在对其创建索引之前,转化处理其文本信息。 Luke 这个工具很强大,luke是一个查询索引的工具...
分类:其他好文   时间:2014-12-02 22:43:16    阅读次数:420
Android 利用jsoup 抓取腾讯应用市场的软件APP,作为我们自己应用的数据
Android 利用jsoup 抓取腾讯应用市场的软件APP,作为我们自己应用的数据...
分类:移动开发   时间:2014-11-29 10:27:47    阅读次数:212
Android网络阅读器_jsoup解析应用
这是一款通过jsoup解析Html获取内容的网络阅读器,大学时期闲暇完成,对照CSDN的Web页面元素设计进行解析提取内容,核心功能就是使用jsoup解析。以下是相关截图: 核心解析代码: package com.weiyi.itreader.util; import java.util.ArrayList; import java.util.List; import org.js...
分类:移动开发   时间:2014-11-26 14:30:06    阅读次数:204
Android IT资讯网络阅读器_jsoup解析
这是一款通过jsoup解析Html获取内容的网络阅读器,和前面的其实是类似的,也是大学时期闲暇完成,对照CSDN的Web页面元素设计进行解析提取内容,核心功能就是使用jsoup解析。以下是相关截图 下载地址:http://www.nduoa.com/apk/detail/434393 代码下载:http://download.csdn.net/detail/weiyiron...
分类:移动开发   时间:2014-11-26 14:27:14    阅读次数:264
路透社新闻 --- jsoup解析html
路透中文网:http://cn.reuters.com/ 本应用主要使用 jsoup 实现html解析和数据展示  所以只取其中三个部分(热点文章,中国财经,国际财经) 其他组件:  PagerSlidingTabStrip ,ViewPager,Fragment结合使用 下拉刷新使用XListView 源码下载地址...
分类:Web程序   时间:2014-11-15 17:10:24    阅读次数:224
Jsoup解析网站输出gson数据
首先要导入jsoup跟gson的jar包。 package com.bjsxt.test; import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.net.URL; import java.net.URLConnection; import...
分类:Web程序   时间:2014-11-01 14:56:58    阅读次数:255
利用jsoup爬取百度网盘资源分享连接(多线程)
用jsoup抓取百度网盘资源链接,并用java实现多线程抓取,提高效率...
分类:编程语言   时间:2014-10-28 10:26:17    阅读次数:299
Java - XPath解析爬取内容
就爬取和解析内容而言,我们有太多选择。比如,很多人都觉得Jsoup就可以解决所有问题。无论是Http请求、DOM操作、CSS query selector筛选都非常方便。 关键是这个selector,仅通过一个表达式筛选出的只能是一个node。如过我想获得一个text或者一个node的属性值,我需要...
分类:编程语言   时间:2014-10-24 21:59:32    阅读次数:241
网页爬虫框架jsoup介绍
序言:在不知道jsoup框架前,由于项目需求,需要定时抓取其他网站上的内容,便想到用HttpClient方式获取指定网站的内容,这种方法比较笨,就是通过url请求指定网站,根据指定网站返回文本解析。说白了HttpClient充当一下浏览器的角色,返回的文本需要自己处理,一般都是用string.indexOf或者string.subString方法处理。         当有一天发现jsoup这个...
分类:Web程序   时间:2014-10-23 00:11:44    阅读次数:181
Jsoup 爬取页面的数据和 理解HTTP消息头
推荐一本书:黑客攻防技术宝典.Web实战篇 ; 顺便留下一个疑问:是否能通过jsoup大量并发访问web或者小型域名服务器,使其瘫痪?其实用jsoup熟悉的朋友可以用它解析url来干一件很无耻的事(源码保密)。呵呵,接下来简单的介绍下JSOUP。 jsoup 是一款基于Java 的HTML解析器,可直接解析某个URL地址、HTML文本字符串、HTML文件。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 官网下载地址:h...
分类:Web程序   时间:2014-10-22 11:06:52    阅读次数:277
471条   上一页 1 ... 40 41 42 43 44 ... 48 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!