码迷,mamicode.com
首页 > 数据库 > 详细

抓取小猪短租列表内容并保存在mongodb里

时间:2017-09-05 21:56:32      阅读:175      评论:0      收藏:0      [点我收藏+]

标签:client   for   ext   text   zip   port   mongodb   int   cli   

import pymongo
import requests
from bs4 import BeautifulSoup
client = pymongo.MongoClient(‘localhost‘,27017)
xiaozhu = client[‘xiazhu‘]
sheet_line = xiaozhu[‘sheet_line‘]
def get_page_within(pages):
for page_numb in range(1,pages+1):
web_data = requests.get(‘http://bj.xiaozhu.com/search-duanzufang-p{}-0/‘.format(page_numb))
soup = BeautifulSoup(web_data.text,‘lxml‘)
titles = soup.select(‘span.result_title‘)
prices = soup.select(‘span.result_price > i‘)
for title,price in zip(titles,prices):
data = {
‘title‘:title.get_text(),
‘price‘:int(price.get_text())
}
sheet_line.insert_one(data)
get_page_within(3)
for item in sheet_line.find({‘price‘:{‘$lt‘:500}}):
print(item)

抓取小猪短租列表内容并保存在mongodb里

标签:client   for   ext   text   zip   port   mongodb   int   cli   

原文地址:http://www.cnblogs.com/gttpython/p/7481922.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!