标签:style blog http color io ar strong sp div
这些第三方Python模块是可选的,不安装的话InfoPi也可以运行。
但是如果安装了,会增加InfoPi的健壮性。
1、chardet
chardet可以自动检测文本的编码。如果安装了,可以用于自动检测网页、xml的编码。
安装命令:
sudo pip3.4 install chardet
如果系统自带python 3.4或以上版本,可能提示没有pip3.4,换成pip-3.x(x为python的具体版本号)试试。
chardet的项目页面: https://pypi.python.org/pypi/chardet/
2、lxml
lxml是更强的xml处理器。
在遇到有缺陷、不规范的xml时,系统自带的xml处理器可能无法解析。
如果安装了lxml,在自带的xml处理器报错时,程序会尝试再用lxml解析。
安装命令:
sudo apt-get install libxml2-dev libxslt1-dev sudo pip3.4 install lxml
第一行安装lxml依赖的两个软件包。
第二行编译、安装lxml,这一步用时较长,大概50分钟。
国内某知名博客的rss生成程序有bug,在做长度截断时可能出现字符&,这样就不符合xml规范了。
这时Python自带的xml处理器会报错,如果安装了lxml,就可以处理这种情况。
lxml的项目页面:https://pypi.python.org/pypi/lxml
标签:style blog http color io ar strong sp div
原文地址:http://www.cnblogs.com/infopi/p/4007089.html