搜索关键字：词库，搜索到312个结果！码迷,mamicode.com！

Python数据挖掘-中文分词

将一个汉字序列切分成一个一个单独的词安装分词模块： pip install jieba 分词在特殊场合的实用性，调用add_word()，把我们要添加的分词加入jieba词库高效方法：将txt保存的词库一次性导入用户词库中 1、搭建语料库 2、介绍分词来自哪篇文章使用数据框的遍历方法，得到语料 ...

分类：编程语言时间：2018-10-01 22:12:43 阅读次数：239

跟我学算法-贝叶斯文本分类器

我们使用了两种提取方式 1 .词频统计 2. 关键字提取关键字提取的方式效果更好一些第一步：数据读取第二步：数据预处理，把每一行的内容拆分成一个个词第三步：与停用词库进行比对，去除内容中的停用词 ‘ 第四步构建模型，这里的数据我们需要做一步‘ ’.join的重连接,对于分类标签需要转换为数 ...

分类：编程语言时间：2018-08-23 02:22:45 阅读次数：248

有道翻译自制接口

思路：背景，自己想做个词典，但是没有庞大词库支持，那就借用某道的吧分割线通过在有道翻译上的查词分析出它是通过post请求而且是ajax异步处理，那么找到请求信息，获取表单数据，找到发送Ajax的js，拼出需要的字段信息，之后……恭喜你，成功了。(●'?'●) 源码： ...

分类：其他好文时间：2018-08-14 22:47:35 阅读次数：248

简易翻译工具

词库：预先准备本地文档，需要英文-中文形式存放，en~这个用表格实现将会更好界面：一个简单的java GUI 功能：输入英文单词，回车，如果词库存在该单词，输出对应的中文意思，不存在则提示不存在实现方法：Frame界面、事件监听、文档读取散列映射具体实现： 0.预定义的词库 1.程序入口： 2 ...

分类：其他好文时间：2018-08-12 17:22:03 阅读次数：200

解决win10下IntelliJ IDEA输入法不跟随的问题

转到IDEA开发环境已经两年了，一直被输入法不跟随的问题困扰着。win7的话搜狗等输入法都可以跟随，但是就是win10有毛病。现在找到一个老版本的QQ输入法是可以实现跟随的，分享出来给大家。（ps...由于版本较老，已经不能使用词库同步功能了）地址自取：链接：https://pan.baidu ...

分类：Windows程序时间：2018-07-24 20:24:50 阅读次数：791

模块5：jieba库的使用

jiaba分词的原理 jiaba分词依靠中文词库 ——利用一个中文词库，确定汉字之间的关联概率 ——汉字间概率大的组成词组，形成分词结果 ——除了分词，用户还可以添加自定义的词组 jiaba库使用说明精确模式、全模式、搜索引擎模式 ——精确模式：吧文本精确的切分开i，不存在冗余单词； ——全模式： ...

分类：其他好文时间：2018-07-05 17:20:14 阅读次数：206

优秀的中文分词jieba库

jieba库的简介 jieba是优秀的中文分词库，中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式：精确模式，全模式，搜索引擎模式。精确模式是将文本精确割分，不存在冗余。全模式是将文本中所有可能单词都扫描出来，存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。常见ji ...

分类：其他好文时间：2018-06-23 14:35:22 阅读次数：255

python词频统计

1.jieba 库 -中文分词库 words = jieba.lcut(str) >列表，词语 count = {} for word in words: if len(word)==1: continue else: count[word] = count.get(word,0)+1 函数 jie ...

分类：编程语言时间：2018-06-02 15:47:47 阅读次数：184

如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化展示

大前天我们通过Python网络爬虫对朋友圈的数据进行了抓取，感兴趣的朋友可以点击进行查看，如何利用Python网络爬虫抓取微信朋友圈的动态（上）和如何利用Python网络爬虫爬取微信朋友圈动态——附代码（下）。今天小编带大家通过词云去将其进行可视化，具体的教程如下。1、在Python中做词云，需要用到wordcloud库和jieba分词库，没有安装的伙伴可以直接pip安装即可。2、之后你可能还需要

分类：编程语言时间：2018-05-16 15:17:44 阅读次数：261

使用ML.NET实现情感分析[新手篇]后补

对《使用ML.NET实现情感分析[新手篇]》一文案例的数据集换成中文，介绍在预处理中如何使用分词。 ...

分类：Web程序时间：2018-05-12 17:35:14 阅读次数：485

共312条上一页 1 ... 8 9 10 11 12 ... 32 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)