python获取kegg pathway map的信息

时间：2020-02-22 23:35:28 阅读：163 评论：0 收藏：0 [点我收藏+]

标签：exce 劳动力 str 抓取 struct ima 目标 excel 翻译

1. 定位及获取目标元素

技术图片
由于这是一个structured data，而且有一定的层次，鉴于需要较快完成信息的整理，所以并没有另外新学structured data信息的爬取（以后再说QAQ）

如果简单的复制粘贴的话，会变成以下模样...
技术图片
（可能要改好久的换行符，我不！！！）

那首先直接抓取最多的元素，省去最多的劳动力
在检查元素后发现，像01100Metabolic pathways这样的元素都分组到某个list中，那么直接driver.find_elements_by_class_name(‘list‘)，就可以获取95%以上的元素啦！
直接将目标元素以下格式输出即可~ （可以用panda库，也可以直接以\t分割复制到excel中）
技术图片

2.excel的有道翻译

由于需要翻译各个通道名，本来想用R调用谷歌翻译API，但是突然发现excel可以自己翻译了！！！
但是翻译水平还有待提高... 虽然还是要人工修改，但是已经省去不少滴工作~

3.excel窗口置顶，将剩余的5%信息复制到excel中

当然也是先爬取网页信息，再粘贴啦，不然一个个复制会死的...
置顶用的是win32gui库

python获取kegg pathway map的信息

标签：exce 劳动力 str 抓取 struct ima 目标 excel 翻译

原文地址：https://www.cnblogs.com/TANGLi83/p/12347975.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行