1、需求 获取58同城上所有房源的标题信息https://bj.58.com/ershoufang/ 2、分析 使用抓包工具进行分析 发现所有的房源标题信息,均存在于ul属性class=house-list-wrap下的li标题中 用xpath形式写为://ul[@class=“house-list ...
分类:
编程语言 时间:
2020-09-09 19:16:29
阅读次数:
70
#!/usr/bin/python import requests from lxml import etree #需求:爬取58二手房中的房源信息 if __name__ == "__main__": headers = { 'User-Agent':'Mozilla/5.0 (Windows N ...
分类:
其他好文 时间:
2020-07-28 10:12:45
阅读次数:
79
# 1、爬取58二手房信息import requests from lxml import etree #需求:爬取58二手房中的房源信息 if __name__ == '__main__': #爬取到页面源码数据 url ="https://bj.58.com/ershoufang/" # 进行U ...
分类:
其他好文 时间:
2020-06-26 14:37:33
阅读次数:
72
随着信息技术的飞速发展,我们的思维也在发生变化..一些较为传统的管理理念不再适合新环境下的房地产中介公司,因此大多数房地产中介公司选择与时俱进,使用智能房地产管理软件来提高公司的管理水平..你知道吗?经纪人日常工作辛苦繁琐,对于经纪人经常处理房源,开单大师可以进行录入房源信息可以做查看,修改,删除,标记,上,转,公/私转台,群发,客房,房源分类,给业主发房源短信,发布房源跟进任务,房源跟进等一系列
分类:
其他好文 时间:
2020-05-14 17:37:28
阅读次数:
82
python 基础 10 正则表达式 1.模块和实际工作的关系 time 模块与时间没啥关系,有没有 time 模块,时间都存在,time模块只是让我们在脚本里更容易去显示和计算时间 re 模块和正则表达式: 有了re模块就可以在 python 里更方便的操作正则表达式了,没有这个模块,正则表达式也 ...
分类:
编程语言 时间:
2020-05-01 23:56:26
阅读次数:
126
Python高级应用程序设计任务要求 用Python实现一个面向主题的网络爬虫程序,并完成以下内容:(注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台) 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 名称:爬取爱彼迎房源信息(泉州地区) 2.主题式网络爬虫爬取的内容 ...
分类:
编程语言 时间:
2019-12-21 09:54:27
阅读次数:
80
一.主题式网络爬虫设计方案 1.主题式网络爬虫的名称 1.1链家房产售价的爬取与分析 2,主题式网络爬虫的内容与数据特征分析 2.1爬虫的内容 房源信息的名称,小区名称,房间数量,房间大小,朝向,装修,楼层,建筑年限,是否为板楼,关注人数,发布时间。 2.2 数据特征分析 2.2.1对装修做一个词云 ...
分类:
编程语言 时间:
2019-12-20 18:14:14
阅读次数:
118
一.主题式网络爬虫设计方案 1.主题式网络爬虫的名称 1.1链家网站的爬取 2,主题式网络爬虫的内容与数据特征分析 2.1爬虫的内容 房源信息的名称,小区名称,价格,楼层,代理人,单价,发布时间。 2.2 数据特征分析 2.2.1对楼层做一个词云并可视化 2.2.2对发布时间做一个折线图 3,主题式 ...
分类:
编程语言 时间:
2019-12-15 23:57:20
阅读次数:
208
58二手房解析房源名称 爬取彼岸图网图片 乱码问题: 1.整体 - response = requests.get(url=xxx,headers=xxx) -response.encoding = 'utf-8' 2. 单独 - xxx.encode('iso-8859-1').decode('g ...
分类:
其他好文 时间:
2019-09-30 14:46:53
阅读次数:
112
第一篇博客情景:前两天被大神打击到了,决定发奋自我,好好努力的学习技术 逛博客中看到有关python的实战题目,选了一道题目挑战一下自己 高德API+Python解决租房问题 该项目编写Python脚本爬取某租房网站的房源信息,利用高德的 js API 在地图上标出房源地点,划出距离工作地点1小时内 ...
分类:
其他好文 时间:
2019-08-20 09:11:23
阅读次数:
108