用python+selenium抓取微博24小时热门话题的前15个并保存到txt中

时间：2016-12-16 01:49:54 阅读：256 评论：0 收藏：0 [点我收藏+]

标签：list

抓取微博24小时热门话题的前15个，抓取的内容请保存至txt文件中，需要抓取阅读数

#coding=utf-8
from selenium import webdriver
import unittest
from time import sleep

class Weibo(unittest.TestCase):

	def setUp(self):
		self.dr = webdriver.Chrome()
		self.hot_list = self.get_weibo_hot_topic()
		self.weibo_topic = self.get_top_rank_file()

	def get_weibo_hot_topic(self):
		self.dr.get(‘http://weibo.com/‘)
		sleep(5)
		self.login(‘649004152@qq.com‘,‘kemi_xxxx‘) #微博帐号密码
		self.dr.get(‘http://d.weibo.com/100803?refer=index_hot_new‘)  #热门话题url
		sleep(5)
		hot_topic_list = []
		i = 0
		while i < 15:
			rank_and_topic = self.dr.find_elements_by_css_selector(‘.title.W_autocut‘)[i].text #定位排行和话题
			number = self.dr.find_elements_by_css_selector(‘.number‘)[i].text #定位阅读数
			hot_topic_list.append([rank_and_topic, number])
			i += 1
		return hot_topic_list

	def get_top_rank_file(self):
		self.file_title = ‘微博24小时热门话题‘
		self.file = open(self.file_title + ‘.txt‘, ‘wb‘)
		for item in self.hot_list:
			separate_line = ‘~~~~~~~~~~~~~~~~~~~~~~~~\n‘
			self.file.write(separate_line.encode(‘utf-8‘))
			self.file.write((item[0]+‘  ‘+‘阅读数：‘+item[1]+‘\n‘).encode(‘utf-8‘))
		self.file.close()

	def login(self, username, password):
		self.dr.find_element_by_name(‘username‘).clear()
		self.dr.find_element_by_name(‘username‘).send_keys(username)
		self.dr.find_element_by_name(‘password‘).send_keys(password)
		self.dr.find_element_by_css_selector(‘.info_list.login_btn‘).click()
		
	def test_weibo_topic(self):
		pass
		print(‘抓取完毕‘)

	def tearDown(self):
		self.dr.quit()

if __name__== ‘__main__‘:
	unittest.main()

网页如下：

技术分享

生成txt文件如下：

技术分享

本文出自 “无想法，无成就！” 博客，请务必保留此出处http://kemixing.blog.51cto.com/10774787/1883205

用python+selenium抓取微博24小时热门话题的前15个并保存到txt中

标签：list

原文地址：http://kemixing.blog.51cto.com/10774787/1883205

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行