学习python时做了一个爬虫爬取百度贴吧的内容,但是用BeautifulSoup得到的结果使用find_all函数却无法获取。 getCommentInfo.py: 1 from urllib import request 2 import requests 3 from bs4 import B ...
分类:
其他好文 时间:
2019-04-20 00:17:05
阅读次数:
176
今天有用户报告了一个issue: 当他访问我们的网站时出现了以下错误: 但是我访问同样的地址却没有这个问题,连续访问多次,查看uWSGI日志发现出现以下ERROR: 原来是请求头的大小超出了uWSGI的buffer大小,默认时4K,我们没有做过修改,既然不够大,那就给大点呗, 修改uwsgi.ini ...
分类:
其他好文 时间:
2019-04-09 18:20:58
阅读次数:
166
百度链接提交工具: http://zhanzhang.baidu.com/linksubmit/index 百度博客提交: http://ping.baidu.com/ping.html 百度信誉申请: http://trust.baidu.com/vstar/feedback 百度死链提交入口: ...
分类:
其他好文 时间:
2019-04-02 10:30:51
阅读次数:
298
出现闪退的原因还是因为缺少C++组件, 下载 DirectXRepairV3.7软件 原文: https://tieba.baidu.com/p/5961511474 软件下载: http://xiazai.zol.com.cn/detail/44/430281.shtml 附上图: ...
分类:
其他好文 时间:
2019-02-01 14:20:07
阅读次数:
220
前言 之前写了一篇文章, "【输入法】Rime 中州韵 基本设置 附:官方定制指南" ,其中导入词库这一块引用其它博主的文章,最近发现那个工具链接已经过期了,参考了百度贴吧的说明,不要直接使用工具去导入会更好,这里使用原作者的做法为大家演示下 前提 安装好rime,无论是ibus rime或fcit ...
分类:
其他好文 时间:
2019-01-13 16:10:50
阅读次数:
375
本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片。 1. 概述 本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片。下载图片的步骤如下: 获取网页html文本内容; 分析html中图片的html标签特征,用正则解析出所有的图片url链接列表; 根据图片的url链接列表将图片下载 ...
分类:
编程语言 时间:
2018-12-31 21:53:13
阅读次数:
189
1. 类的约束 1. 写一个父类. 父类中的某个方法要抛出一个异常 NotImplementedError 2. 抽象类和抽象方法 from abc import ABCMeta, abstractmethod class Base(metaclass = ABCMeta): @abstractme ...
分类:
编程语言 时间:
2018-12-21 21:20:44
阅读次数:
188
1 个人主要完成队长安排下来的任务,配合其他两各位组员,争取把项目做好。总算有一些成果出现。 2 在这次百度贴吧小爬虫的开发中,使我对python有了深入的学习,整个项目我们都有明确的分工,在两位组员的帮助下,我能够按时的完成组长分配的各项任务, 完成图形化操作界面,类似于百度搜索界面设计;完成任务 ...
分类:
其他好文 时间:
2018-12-05 12:41:00
阅读次数:
172