码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
NLP学习-----1
NLP = NLU + NLG 分词 工具: 1、 "jieba" 2、 "SnowNLP" 3、 "LTP" 前向最大匹配(forward max matching) ...
分类:其他好文   时间:2020-03-27 22:02:02    阅读次数:132
项目报告(一)
今天采用jieba分词,和kmains算法对数据库中的关键词进行了切分以及矩阵化,并且通过算法对其进行了聚类 最终聚类的结果为:(第一行代表的是关键词的行数,第二行代表所划分的类) 然后对用一个树图的形式,对数据进行了可视化展示 结果如图: ...
分类:其他好文   时间:2020-03-20 20:37:35    阅读次数:66
从文本中提取关键字
就在前几天的任务中用到了从文本描述中提取关键字的操作,特意从网上找到了一些提取关键字的方法。 总结如下:需要引入jieba这个库文件 基于TF-IDF算法进行关键词提取 import jieba.analyse sentence = "人工智能(Artificial Intelligence),英文 ...
分类:其他好文   时间:2020-03-16 21:52:58    阅读次数:94
2020/3/13-大数据应用极限测试每日总结
砍柴ing 今天主要进行数据清洗及处理 # -*- coding: gbk -*- import json import pymysql import jieba.analyse ##生成三个表:用来做地图可视化 ##表province:省:项目数 ##表city:市:项目数 ##表contie:县 ...
分类:其他好文   时间:2020-03-15 16:25:44    阅读次数:84
数据分析练习-3.13进度
今天在昨天的基础上继续做了关键词提取的实现,将没有关键词的数据根据成果简介提取其关键词。 部分源代码: 1 import math 2 3 import jieba 4 5 import jieba.posseg as psg 6 7 from gensim import corpora, mode ...
分类:其他好文   时间:2020-03-14 01:14:39    阅读次数:66
关键字的获取
要求: 从一段“简介”中提取出“关键字”。 实现: 利用python通过jieba对“关键字”进行提取。 ...
分类:其他好文   时间:2020-03-14 00:46:03    阅读次数:48
python统计word文档中的词频
如何将统计word文档中的词频呢?先用docx模块将word文档转变成txt格式,然后使用jieba模块进行分词,并统计词频。是不是很简单~#2020年3月10日#ElizabethfromdocximportDocumentimportjieba#分词模块#自定义函数,将word文档写入txt文档defto_txt(path):document=Document(path)txt=open(‘/
分类:编程语言   时间:2020-03-10 23:29:42    阅读次数:99
【python数据挖掘】使用词云分析来分析豆瓣影评数据
概述: 制作词云的步骤: 1、从文件中读取数据 2、根据数据追加在一个字符串里面,然后用jieba分词器将评论分开 3、设置WordCloud词云参数 4、保存最后的结果 数据: "使用爬取的豆瓣影评数据" 第一步:引入依赖库 第二步:读取数据 第三步:解析数据并保存 效果图: 模型: 效果: 源代 ...
分类:编程语言   时间:2020-02-26 21:17:28    阅读次数:122
python中实现词云图
import matplotlib.pyplot as plt import jieba from wordcloud import wordcloud # 1.读出词语 text = open('text/test.txt', 'r', encoding='utf-8').read() print ...
分类:编程语言   时间:2020-02-25 19:48:29    阅读次数:83
Word2Vec 计算词语之间的余弦相似度
python中常用的分析文档、计算词语相似度的包 —— Word2Vec函数;该函数在gensim.models.Word2Vec包内。 分析文本和计算相似度有几个步骤: 导入需要用到的库: # 导入第三包 import jieba import pandas as pd import gensim ...
分类:其他好文   时间:2020-02-22 16:05:44    阅读次数:135
462条   上一页 1 ... 6 7 8 9 10 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!