码迷,mamicode.com
首页 > 编程语言 > 详细

python下载日语语法并保存为pdf

时间:2019-06-24 13:54:42      阅读:114      评论:0      收藏:0      [点我收藏+]

标签:step   路径   www   arp   parse   content   xpl   res   for   

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

__author__ = 'jiangwenwen'

import pdfkit
import requests
from bs4 import BeautifulSoup

# 获取所有的语法列表
response = requests.get("http://www.coelang.tufs.ac.jp/mt/ja/gmod/steplist.html")
soup = BeautifulSoup(response.content, 'html.parser')
grammarList = soup.find_all("li", class_="list")

# 循环语法列表
for grammar in grammarList:
    # 语法标题
    grammarTitle = grammar.a.string.replace('/', '/')
    # 语法链接
    grammarURL = "http://www.coelang.tufs.ac.jp/mt/ja/gmod/contents/explanation/%s.html" % (grammar.a.get('href')[-8:-5])
    # 语法内容
    grammarContent = requests.get(grammarURL).text
    # 语法保存路径
    grammarPath = r'/home/grammar/%s.pdf' % grammarTitle
    # 转换为pdf文件
    pdfkit.from_url(grammarContent, grammarPath)

python下载日语语法并保存为pdf

标签:step   路径   www   arp   parse   content   xpl   res   for   

原文地址:https://www.cnblogs.com/jiangwenwen1/p/11076546.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!