因为一直无法下载python中wordcloud的相关文件,于是便使用了网上词云的生成器。网址是:https://timdream.org/wordcloud 运行效果图: 此次爬取的是一个关于区块链的新闻内容,通过使用python爬取新闻页面的内容,然后使用网上的词云生成器生成词。 ...
分类:
其他好文 时间:
2018-04-30 18:09:41
阅读次数:
241
1.主题 爬取小说网站的《全职高手》小说第一章 2.代码 导入包 取出所需要的标题和正文 定义一个获取所有章节 url的函数 去掉句子中多余的部分 将数据放入txt文本文件 读取要生成词云的文件和生成形状的图片 进行分隔 设置词云生成图片的样式 显示词云生成的图片 3.数据截图 4.遇到的问题及解决 ...
分类:
其他好文 时间:
2018-04-30 17:57:58
阅读次数:
200
本文爬取了掘金上关于前端前n页的标题。将文章的标题进行分析,可以看出人们对前端关注的点或者近来的热点。 获取动态网页的具体内容 爬取动态网页时标题并不能在html里直接找到,需要通过开发者工具里的Network去寻找。寻找到的是ajax发出的json数据。 获取json里面的具体某个数据 我们获取到 ...
分类:
Web程序 时间:
2018-04-30 14:30:22
阅读次数:
327
1.选一个自己感兴趣的主题(所有人不能雷同)。 答:爬取李冰冰微博主页信息 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 4.对文本分析结果进行解释说明。 答:文本获取到的字符信息并不是我们想要的效果,因此,为了达到我们想要的效果,我就将所 ...
分类:
其他好文 时间:
2018-04-30 11:40:50
阅读次数:
319
1.主题: 简单爬取简书中的专题‘’@IT·互联网“中的文章,爬取信息之后通过jieba分词生成词云并且进行分析; 2.实现过程: 第一步:打开简书并进入到@IT-互联网专题 网页链接:https://www.jianshu.com/c/V2CqjW?utm_medium=index-collect ...
分类:
编程语言 时间:
2018-04-29 22:13:59
阅读次数:
332
对豆瓣读书网进行书评书单推荐简介和推荐链接数据爬取: 将所爬的数据存储在mark down文件中: 截图: 词云生成截图: 相关问题: 1.在电脑无法安装词云wordcloud,将代码复制在在线词云生成器进行词云生成; 2.数据无法直接保存至文本文件,改用mark down 文件存储; ...
分类:
其他好文 时间:
2018-04-29 17:49:33
阅读次数:
222
1.选一个自己感兴趣的主题(所有人不能雷同)。 主题:爬取足球新闻相关信息 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 txt 词云: 4.对文本分析结果进行解释说明。 文本内容通过对新闻网站的某个球队的新闻爬取,分别有标题、来源、内容等 ...
分类:
其他好文 时间:
2018-04-28 10:50:53
阅读次数:
96
打开酷我新歌排行榜,网址是http://www.kuwo.cn/bang/index 代码: 用requests库和BeautifulSoup库,爬取酷我新歌榜当前页面的每首的曲目、作者、歌词、排行、链接等,将获取歌曲详情的代码定义成一个函数 生成词云: ...
分类:
其他好文 时间:
2018-04-28 01:27:59
阅读次数:
168
制作过程中遇到三个问题,一个是文件用w+打开后写完数据进去读取不出来,后来在读前再打开一次文件解决了 二是将列表排序后想取出里面的str,解决方式:问刘东 三是安装wordcloud不成功,改用在线词云生成器== ...
分类:
其他好文 时间:
2018-04-27 21:12:57
阅读次数:
159