from lxml import etree from pymysql import connect from jieba.analyse import * import requests class CVPR: # 保存数据 def saveContent_list(self,title,zhai ...
分类:
其他好文 时间:
2020-06-10 21:32:25
阅读次数:
99
1. 编码问题 (这两天unicode真是令我头大) pymysql.connect时提示“UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 29: ordinal not in range(128)” 解决办法 ...
分类:
编程语言 时间:
2020-06-05 15:03:17
阅读次数:
72
安徽工程大学 Python程序设计 实验报告 班级 物流192 姓名 刘晨晨 学号 3190505214 日期 2020.6.3 指导老师 修宇 【实验名称】实验八 文件 【实验目的】 掌握读写文本文件或 CSV 文件,进而对数据进行处理的方法。 【实验条件】 PC机或者远程编程环境 【实验内容】 ...
分类:
编程语言 时间:
2020-06-03 10:48:59
阅读次数:
487
jieba是python的第三方库,使用jieba库需要先安装。jieba是一个中文分词库,可以根据所给的中文句子,提取出可能的词组 jieba库分词依靠词库。利用中文词库,确定汉字之间的关联概率。概率大的组成词组,形成分词效果。除了分词,用户还可以添加自定义的词组 jieba提供了三种分词模式,精 ...
分类:
其他好文 时间:
2020-05-31 18:11:27
阅读次数:
429
代码如下: #BatchInstall.py import os libs = {'numpy','matplotlib','pillow','sklearn','requests',\ 'jieba','beautifulsoup4','wheel','networkx','sympy',\ 'p ...
分类:
编程语言 时间:
2020-05-31 15:53:27
阅读次数:
89
import jieba import matplotlib.pyplot as plt from wordcloud import WordCloud #读取指定文件 f = open(r'.\data.txt', encoding='utf-8').read() #对数据进行jieba中文分词, ...
分类:
编程语言 时间:
2020-05-26 15:35:46
阅读次数:
94
#!/usr/bin/python3 import sys import imp import jieba import jieba.posseg as psg import urllib.parse ################################################# ...
分类:
编程语言 时间:
2020-05-25 09:21:03
阅读次数:
106
1.根据训练集语料库,计算出tfidf值 2.计算出测试语句每个词语的tfidf值(只有当测试语句的词语在训练语料库的dictionary中,测试语句的词语才会计算tfidf值) import jieba from gensim import corpora, similarities, model ...
分类:
其他好文 时间:
2020-05-23 16:30:17
阅读次数:
106
处理excel表格 openpyxl,csvkit NLP领域(人工智能) 自然语言 NLTK[业内使用较频繁],jieba,SnowNLP HTTP requests – 人性化的HTTP请求库。 grequests – requests 库 + gevent ,用于异步 HTTP 请求. [比r ...
分类:
其他好文 时间:
2020-05-23 11:27:04
阅读次数:
64
我希望对mxs自动排除后,让变量更加可读,setmaxsize,或者SETMAXSIZE,转变成setMaxSize,这就需要把单词给他分离开来 中文有jieba 英文有wordninja c 啥都没有 ...
分类:
编程语言 时间:
2020-05-21 19:57:33
阅读次数:
104