码迷,mamicode.com
首页 >  
搜索关键字:词云    ( 302个结果
爬虫大作业
因为一直无法下载python中wordcloud的相关文件,于是便使用了网上词云的生成器。网址是:https://timdream.org/wordcloud 运行效果图: 此次爬取的是一个关于区块链的新闻内容,通过使用python爬取新闻页面的内容,然后使用网上的词云生成器生成词。 ...
分类:其他好文   时间:2018-04-30 18:09:41    阅读次数:241
爬虫大作业
1.主题 爬取小说网站的《全职高手》小说第一章 2.代码 导入包 取出所需要的标题和正文 定义一个获取所有章节 url的函数 去掉句子中多余的部分 将数据放入txt文本文件 读取要生成词云的文件和生成形状的图片 进行分隔 设置词云生成图片的样式 显示词云生成的图片 3.数据截图 4.遇到的问题及解决 ...
分类:其他好文   时间:2018-04-30 17:57:58    阅读次数:200
关于爬取json内容生成词云(疯狂踩坑)
本文爬取了掘金上关于前端前n页的标题。将文章的标题进行分析,可以看出人们对前端关注的点或者近来的热点。 获取动态网页的具体内容 爬取动态网页时标题并不能在html里直接找到,需要通过开发者工具里的Network去寻找。寻找到的是ajax发出的json数据。 获取json里面的具体某个数据 我们获取到 ...
分类:Web程序   时间:2018-04-30 14:30:22    阅读次数:327
爬虫大作业
1.选一个自己感兴趣的主题(所有人不能雷同)。 答:爬取李冰冰微博主页信息 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 4.对文本分析结果进行解释说明。 答:文本获取到的字符信息并不是我们想要的效果,因此,为了达到我们想要的效果,我就将所 ...
分类:其他好文   时间:2018-04-30 11:40:50    阅读次数:319
python爬虫(以简书为例)
1.主题: 简单爬取简书中的专题‘’@IT·互联网“中的文章,爬取信息之后通过jieba分词生成词云并且进行分析; 2.实现过程: 第一步:打开简书并进入到@IT-互联网专题 网页链接:https://www.jianshu.com/c/V2CqjW?utm_medium=index-collect ...
分类:编程语言   时间:2018-04-29 22:13:59    阅读次数:332
爬虫大作业
对豆瓣读书网进行书评书单推荐简介和推荐链接数据爬取: 将所爬的数据存储在mark down文件中: 截图: 词云生成截图: 相关问题: 1.在电脑无法安装词云wordcloud,将代码复制在在线词云生成器进行词云生成; 2.数据无法直接保存至文本文件,改用mark down 文件存储; ...
分类:其他好文   时间:2018-04-29 17:49:33    阅读次数:222
爬虫大作业(虎扑足球新闻)
背景图 字体颜色图 词云图 ...
分类:其他好文   时间:2018-04-28 21:09:14    阅读次数:206
爬虫大作业之广商足球快讯(爬取足球新闻)
1.选一个自己感兴趣的主题(所有人不能雷同)。 主题:爬取足球新闻相关信息 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 txt 词云: 4.对文本分析结果进行解释说明。 文本内容通过对新闻网站的某个球队的新闻爬取,分别有标题、来源、内容等 ...
分类:其他好文   时间:2018-04-28 10:50:53    阅读次数:96
爬虫大作业
打开酷我新歌排行榜,网址是http://www.kuwo.cn/bang/index 代码: 用requests库和BeautifulSoup库,爬取酷我新歌榜当前页面的每首的曲目、作者、歌词、排行、链接等,将获取歌曲详情的代码定义成一个函数 生成词云: ...
分类:其他好文   时间:2018-04-28 01:27:59    阅读次数:168
爬虫大作业
制作过程中遇到三个问题,一个是文件用w+打开后写完数据进去读取不出来,后来在读前再打开一次文件解决了 二是将列表排序后想取出里面的str,解决方式:问刘东 三是安装wordcloud不成功,改用在线词云生成器== ...
分类:其他好文   时间:2018-04-27 21:12:57    阅读次数:159
302条   上一页 1 ... 19 20 21 22 23 ... 31 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!