在爬取的过程中发现,访问频率太快会导致网站弹出滑动验证,所以设定了时间随机时间延迟,这样子就能保证爬取的信息完整,我选的是青岛市的小区,后续也可以添加输入市名爬取相关内容,二级页面的房子的平均价格是动态生成的,需要发送一个请求得到一个json,请求的url比较复杂,而且还要再发送一次请求,因此直接在 ...
分类:
其他好文 时间:
2019-10-27 11:10:15
阅读次数:
216
在爬取的过程中发现,访问频率太快会导致网站弹出滑动验证,所以设定了时间随机时间延迟,这样子就能保证爬取的信息完整,我选的是青岛市的小区,后续也可以添加输入市名爬取相关内容,二级页面的房子的平均价格是动态生成的,需要发送一个请求得到一个json,请求的url比较复杂,而且还要再发送一次请求,因此直接在 ...
分类:
其他好文 时间:
2019-09-24 12:14:13
阅读次数:
114
补上数据库获取到的数据。。创建数据库的时候,最好添加一个city的字段,要不然太乱了 ...
分类:
编程语言 时间:
2019-05-04 11:47:53
阅读次数:
185
之前没课的时候写过安居客的爬虫,但那也是小打小闹,那这次呢, 还是小打小闹 哈哈,现在开始正式进行爬虫书写 首先,需要分析一下要爬取的网站的结构: 作为一名河南的学生,那就看看郑州的二手房信息吧! 在上面这个页面中,我们可以看到一条条的房源信息,从中我们发现了什么,发现了连郑州的二手房都是这么的贵, ...
分类:
编程语言 时间:
2019-04-22 20:56:54
阅读次数:
414
近日,苏州市民赵先生向江苏新闻广播新闻热线025-84658888反映,他在“安居客”手机应用软件上浏览二手房信息,并且使用该软件自动生成的虚拟号码向当地一家中介公司进行咨询。可电话刚挂不久,中介公司方面就掌握了赵先生的真实电话号码,个人信息疑似遭到泄露。多位中介公司人员确认,他们确实能从安居客网站 ...
分类:
其他好文 时间:
2019-04-20 23:00:38
阅读次数:
1281
1、一楼一般略潮湿,隐私性不好,不过也便宜点。 2、一般整租比较便宜,最好找朋友一起去整租,中介的话有很多,我爱我家和链家等等都可以。 自如APP和蘑菇租房以及安居客上面的房子房产中介可以带你去看吗,服务可以,可以省去麻烦,快速找房。 3、自己找房源的话,有zuber APP,拼室友,合租找室友,z ...
分类:
其他好文 时间:
2018-10-26 00:08:45
阅读次数:
260
本次爬取安居客网站,获取上海长宁区的租房信息,参考自:微信公众号 仍然是用scrapy框架构建爬虫,步骤:1.分析网页 2.items.py 3.spiders.py 4. pipelines.py 5.settings.py 观察网页 上海长宁区租房信息: https://sh.zu.anjuke ...
分类:
其他好文 时间:
2018-10-22 10:20:06
阅读次数:
1050
从切换城市的分类方式就能看出来,因覆盖城市很多,搜房网(房天下)跟安居客都用上了拼音选房,而链家因城市很少,只需简单罗列即可。 搜房网(房天下)覆盖城市多达651个,覆盖范围最广,安居客为500个,两者基本实现了国内主要城市的全覆盖。链家APP只覆盖19个城市,这与链家重线下的业务模式不无关系。 在 ...
分类:
移动开发 时间:
2018-06-07 19:18:10
阅读次数:
739
安居客:背靠58,2017年被安居客收购 链家:2018年4月份推出贝壳找房 非凡:背靠万达 自如:链家旗下,租房O2O,线上预约,线上签约,租后服务 2016:链家-安居客-搜房网-非凡-aribnb-自如生活-蚂蚁短租-平安好房-房多多-爱屋及屋-搜房帮-丁丁租房-住这儿-好房拓-我爱我家-喵街 ...
分类:
其他好文 时间:
2018-06-07 14:24:19
阅读次数:
189
目标:爬取安居客网站上前10页北京二手房的数据,包括二手房源的名称、价格、几室几厅、大小、建造年份、联系人、地址、标签等。 网址为:https://beijing.anjuke.com/sale/ BeautifulSoup官网:https://www.crummy.com/software/Bea ...
分类:
编程语言 时间:
2018-04-16 10:17:16
阅读次数:
253