原文:使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码,拒绝正则表达式)废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时...
分类:
Web程序 时间:
2014-06-27 20:32:13
阅读次数:
270
中文乱码:在以后学习过程中全部采用UTF-81、文件的乱码1.1、项目文本文件默认编码: 【右击项目】->【Properties】->【Resource】->【Text file encoding】1.2、文件默认编码:默认使用项目的默认编码 【右击文件】->【Properties】->【Reso....
分类:
编程语言 时间:
2014-06-27 16:21:08
阅读次数:
219
import urllib2response=urllib2.urlopen('http://house.focus.cn/')html=response.read()print html.decode('gbk')
分类:
编程语言 时间:
2014-06-27 00:50:29
阅读次数:
333
系统版本:CentOS 6.3_x86_64zabbix版本:zabbix-2.2.3zabbix服务端IP:172.16.10.721.yum安装LAMP环境# yum -y install gcc gcc-c++ autoconf httpd php mysql mysql-server php...
分类:
其他好文 时间:
2014-06-27 00:39:01
阅读次数:
1087
常有的方法,get请求用在tomcat的编码改为utf-8 即可post 过滤器就可以一、常识了解1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立;2.java.nio.charset.Charset.defaultCharset()获得平台默认字符编码;3...
分类:
其他好文 时间:
2014-06-26 23:02:53
阅读次数:
346
一、设置编辑器的编码Tools->Tools Properties ->General->File Encoding 设置为UTF-8二、如果数据库为UTF-8,则要在连接时做以下设置cloud_dev?generateSimpleParameterMetadata=true&useUnicode=...
分类:
数据库 时间:
2014-06-26 22:18:34
阅读次数:
416
异步方式,返回json给前台时,向前台输出信息使用PrintWriter,但是在输出的过程中,出现乱码的情况。于是我想起来response.setCharacterEncoding("utf-8");设置页面编码,以及response.setContentType("text/html; char....
分类:
其他好文 时间:
2014-06-26 22:17:55
阅读次数:
542
在一般情况下,propertites文件在eclipse中的显示中文一直显示乱码,想要解决这个问题,需要通过在eclipse中安装一个Propertites Editor插件来进行解决。 在Eclipse Marketplace中选择Propertites Editor, 插件安装: 安装后,pro...
分类:
系统相关 时间:
2014-06-26 18:51:20
阅读次数:
276
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:57:58
阅读次数:
373
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:53:48
阅读次数:
232