码迷,mamicode.com
首页 > 编程语言 > 详细

python学习笔记:"爬虫+有道词典"实现一个简单的英译汉程序

时间:2015-05-04 06:24:23      阅读:226      评论:0      收藏:0      [点我收藏+]

标签:

1.有道的翻译

网页: www.youdao.com

技术分享

Fig1

技术分享

Fig2

 

技术分享

Fig3

技术分享

Fig4

再次点击"自动翻译"->选中‘Network‘->选中‘第一项‘,如下:

技术分享

Fig5

然后显示出如下内容,红框画出的部分是等会编写代码需要的地方:

技术分享

Fig6

技术分享

Fig7

再看看翻译的结果:

技术分享

Fig8

2.python实现英译汉:

原理:把需要翻译的内容输入给有道词典,然后通过程序把翻译的结果爬下来。

 1 # -*- coding:utf-8 -*-  
 2 """
 3 Created on Sun May 03 09:36:12 2015
 4 
 5 @author: 90Zeng
 6 """
 7 
 8 import urllib
 9 import json
10 
11 # 注意这里用unicode编码,否则会显示乱码
12 content = input(u"请输入要翻译的内容:")
13 # 网址是Fig6中的 Response URL
14 url = http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/
15 # 爬下来的数据 data格式是Fig7中的 Form Data
16 data = {}
17 data[type] = AUTO
18 data[i] = content
19 data[doctype] = json
20 data[xmlVersion] = 1.6
21 data[keyfrom] = fanyi.web
22 data[ue] = UTF-8
23 data[typoResult] = true
24 
25 # 数据编码
26 data = urllib.urlencode(data)
27 
28 # 按照data的格式从url爬内容
29 response = urllib.urlopen(url, data)
30 # 将爬到的内容读出到变量字符串html,
31 html = response.read()
32 # 将字符串转换成Fig8所示的字典形式
33 target = json.loads(html)
34 # 根据Fig8的格式,取出最终的翻译结果
35 result = target["translateResult"][0][0][tgt]
36 
37 # 这里用unicode显示中文,避免乱码
38 print(u"翻译结果:%s" % (target["translateResult"][0][0][tgt]))

 

运行:

技术分享

技术分享


 

学习资料来源:小甲鱼的视频‘零基础入门python’

 

python学习笔记:"爬虫+有道词典"实现一个简单的英译汉程序

标签:

原文地址:http://www.cnblogs.com/90zeng/p/python_translation.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!