码迷,mamicode.com
首页 > 编程语言 > 详细

Python爬取内涵段子里的段子

时间:2018-02-24 19:27:48      阅读:155      评论:0      收藏:0      [点我收藏+]

标签:爬虫   内涵段子   

环境:Python3.6



#!/usr/bin/env python3
#-*-coding:utf-8-*-
#version:3.6.4
__author__ = '杜文涛'

import requests
import json


def get_json_dic(url):
    global dict_json
    response = requests.get(url=url)
    json_response = response.content.decode() #获取r的文本 就是一个json字符串
    dict_json = json.loads(json_response) #  将json字符串转换成dic字典对象

    return dict_json

def get_joke(dict_json):
    print(len(dict_json['data']['data']))
    for i in range(1,20):
        conture = input('是否继续,Y/N')
        if conture == 'Y' or conture == 'y':
            joke = dict_json['data']['data'][i]['group']['text']
            if i == 19:
                dict_json = {}
                conture
            print(joke)
        else:
            exit()

def get_max_time(dic_json):
    global max_time
    max_time = dict_json['data']['max_time']
    return max_time

if __name__ == '__main__':
    max_time = 1519404642
    url = 'http://www.neihanshequ.com/joke/?is_json=1&app_name=neihanshequ_web&max_time=' + str(max_time)

    get_json_dic(url)
    get_max_time(dic_json=dict_json)
    get_joke(dict_json=dict_json)

    while True:
        url = 'http://www.neihanshequ.com/joke/?is_json=1&app_name=neihanshequ_web&max_time=' + str(max_time)
        get_json_dic(url)
        get_max_time(dic_json=dict_json)
        get_joke(dict_json=dict_json)
        print(url)

微信公众号:

技术分享图片

Python爬取内涵段子里的段子

标签:爬虫   内涵段子   

原文地址:http://blog.51cto.com/tdcqvip/2072704

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!