在用Python写爬虫时,一个常见的操作是对抓下的HTML做分析处理,得到想要的内容。一般的方法为使用Python的re库中,用正则表达式来解析文本。不过这种方法适用于所有的文本,而针对于特定格式的文本,如这里的HTML,BeautifulSoup更具有针对性,使用起来也更方便。
BeautifulSoup可以解析HTML,XML等文件,这里只说明其解析HTML的功能。
Beautifu...
分类:
编程语言 时间:
2014-05-22 12:56:51
阅读次数:
682
上一篇介绍了Python对文件的读写操作,现在来介绍一下Python对文件夹的操作。由于我是项目中用到的,所以我就以我的实际应用实例来说明吧。希望对大家有所帮助。...
分类:
编程语言 时间:
2014-05-22 12:29:44
阅读次数:
192
继续设计模式~ 模版方法模式
老套路,先看下定义:定义了一个算法的骨架,而将一些步骤延迟到子类中,模版方法使得子类可以在不改变算法结构的情况下,重新定义算法的步骤。
简单看下定义,模版方法定义了一个算法的步骤,并且允许子类为一个或多个步骤提供实现。定义还算清晰,下面来个例子展示下本公司的上班情况(纯属娱乐,如有雷同,请对号入座)。简单描述一下:本公司有程序猿、测试、HR、项目经理等人,下面使用...
分类:
其他好文 时间:
2014-05-22 12:15:55
阅读次数:
262
简介
此文档描述了一个超级用户如何在安全的方式下以另一用户的名义提交作业或访问hdfs。
Use Case
下一部分描述的的代码示例对此用户用例是可用的。
一个用户名为'super'的超级用户想要以另一用户joe的名义提交作业或访问hdfs。超级用户有kerberos证书但是用户joe并没有。任务要求以用户joe的角色运行并且namenode上的文件访问也需要由joe完成。需要用户...
分类:
其他好文 时间:
2014-05-22 10:40:41
阅读次数:
255
大家使用Python这门语言,大多是作为一门脚本语言来使用。这里熟悉下python的面向对象的特性。
1、几个基本概念
1.1 面向过程和面向对象
根据操作数据的函数或语句块来设计程序的过程,叫做面向过程编程。与之相对应的,如果把数据和功能结合起来,用称为对象的东西包裹起来,这种组织程序的方法称为面向对象的编程。面向对象的编程一般用在稍微大型的项目或者是要求更加合理的解决方案的场合,相对与面...
分类:
编程语言 时间:
2014-05-22 10:18:15
阅读次数:
414
想了个挺二的例子
剑客是刺客,是被锁定的目标,...
分类:
编程语言 时间:
2014-05-22 09:39:57
阅读次数:
300
转换接口。
引入新原则: ” 最少知识“原则 作用为 外观模式
面向对象的适配器:将一个接口转换成另一个接口,以符合客户的期望。
对象适配器 与 类适配器
OO原则:(1)封装变化 (2)多用组合,少用继承 (3)针对接口编程,不针对实现编程 (4)为交互对象之间的松耦合设计而努力 (5)类应该对扩展开放,对修改关闭。(6) 依赖抽象,不要依赖具体类。(7)只和朋友交流。
...
分类:
其他好文 时间:
2014-05-22 09:22:37
阅读次数:
268
在经历股市多年的大起大落、大赚大赔之后,痛定思痛,深切感到在金融市场拼搏,必须建立健全交易纪律守则,严格执行。
这套完整的纪律守则,就是“交易系统”。在许多方面,它与一般的专家系统相近似。
专家系统的最佳开发工具,是Erlang下的Eresye。它的缺点是,其他语言如C、Python对它的调用不方便。
如果主程序是C或Python,一般需将Eresye做成服务器,通过sockets通讯调用,...
分类:
其他好文 时间:
2014-05-22 09:18:46
阅读次数:
237
Mayuyu学习Python很久了,今天就开始学习Python的网络编程。
其实说到网络编程,就必须提到一个关键词---“套接字”,即Socket。网络化的应用程序在开始任何通讯之前都需
要创建套接字,就像电话插口一样,没有它就没有办法进行通讯。对于套接字来说,一般分为两种:基于文件型和基
于网络型。套接字实质上就是一个通信端点。当然,我们可以创建面向连接的套接字或者面向无连接的套接字...
分类:
其他好文 时间:
2014-05-22 08:38:29
阅读次数:
221
刚刚接触Python,感觉其对文件的操作还是很方便的。下面是我入门Python对文件操作的一个简单程序,希望对初学者有所帮助。...
分类:
编程语言 时间:
2014-05-20 17:14:28
阅读次数:
373