#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘ ...
分类:
其他好文 时间:
2020-01-10 20:14:25
阅读次数:
283
# 导入扩展库import re # 正则表达式库import collections # 词频统计库import numpy as np # numpy数据处理库import jieba # 结巴分词import wordcloud # 词云展示库from PIL import Image # 图 ...
分类:
编程语言 时间:
2020-01-04 11:05:07
阅读次数:
81
一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 主题名称:豆瓣音乐专区的摇滚音乐 2.主题式网络爬虫爬取的内容与数据特征分析 爬取豆瓣音乐专区的摇滚音乐歌手、链接及受喜爱的人数 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:爬取获得的豆瓣音乐的HTML页面,使用B ...
分类:
编程语言 时间:
2019-12-21 20:48:23
阅读次数:
107
用Python实现一个面向主题的网络爬虫程序,并完成以下内容:(注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台) 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 爬取虎牙直播英雄联盟播放信息 2.主题式网络爬虫爬取的内容与数据特征分析 此次爬虫主要尝试爬取虎牙直播英 ...
分类:
编程语言 时间:
2019-12-21 19:03:22
阅读次数:
102
#导入需要模块 import jieba import numpy as np import matplotlib.pyplot as plt from PIL import Image from wordcloud import WordCloud, STOPWORDS, ImageColorGe ...
分类:
编程语言 时间:
2019-12-21 13:54:48
阅读次数:
225
Python高级应用程序设计任务要求 用Python实现一个面向主题的网络爬虫程序,并完成以下内容:(注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台) 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 名称:爬取爱彼迎房源信息(泉州地区) 2.主题式网络爬虫爬取的内容 ...
分类:
编程语言 时间:
2019-12-21 09:54:27
阅读次数:
80
2019-12-12中文文本分词和词云图具体功能介绍与学习代码: import jiebaa="由于中文文本的单词不是通过空格或者标点符号来进行分割"#jieba.lcut()s是最常用的中文分词函数,用于精准模式,即将字符串分割为等量的中文词组,返回结果是列表类型print(jieba.lcut( ...
分类:
编程语言 时间:
2019-12-13 00:13:05
阅读次数:
134
和上一篇相比,差别不是很大 1 import xlrd#读取excel 2 import xlwt#写入excel 3 import requests 4 import linecache 5 import wordcloud 6 import jieba 7 import matplotlib.p ...
分类:
编程语言 时间:
2019-12-09 01:23:28
阅读次数:
79
爬虫:requests,beautifulsoup 词云:wordcloud,jieba 代码加注释: 1 # -*- coding: utf-8 -*- 2 import xlrd#读取excel 3 import xlwt#写入excel 4 import requests 5 import l ...
分类:
编程语言 时间:
2019-12-07 00:54:50
阅读次数:
203
题1:无空隙回声输出 描述 获得用户输入,去掉其中全部空格,将其他字符按收入顺序打印输出。 ???????????????????????????????????????????????????????????????????????????????????????????????? 输入输出示例 ...
分类:
其他好文 时间:
2019-12-06 22:03:44
阅读次数:
121