码迷,mamicode.com
首页 >  
搜索关键字:文本分类    ( 340个结果
基于文本分类的软件缺陷管理
[摘要] 随着计算机科学技术的快速发展,软件的应用领域逐步推广,软件规模和成本逐渐增大,软件设计的复杂程度不断提高,软件开发中出现错误或缺陷的机会越来越多,同时,市场对软件质量重要性的认识逐渐增强。所以,缺陷管理作为软件生命周期的一部分,其在软件项目实施过程中的重要性日益突出,是保证软件质量的重要手 ...
分类:其他好文   时间:2021-06-24 18:09:43    阅读次数:0
使用微调后的Bert模型做编码器进行文本特征向量抽取
通常,我们使用bert做文本分类,泛化性好、表现优秀。在进行文本相似性计算任务时,往往是对语料训练词向量,再聚合文本向量embedding数据,计算相似度;但是,word2vec是静态词向量,表征能力有限,此时,可以用已进行特定环境下训练的bert模型,抽取出cls向量作为整个句子的表征向量以供下游 ...
分类:其他好文   时间:2021-04-15 12:20:10    阅读次数:0
【目录】NLP相关理论及应用
工业界nlp相关的实际应用和框架 目录: Word2Vec词向量简述 word2vec模型训练简单案例 tf-idf、朴素贝叶斯的短文本分类简述 tensorflow文本分类实战——卷积神经网络CNN word2vec+textcnn文本分类简述及代码(包含中文文本分类实战) 使用inception ...
分类:其他好文   时间:2020-11-08 17:02:05    阅读次数:20
毕业设计之 --- 新闻分类系统
简介新闻分类课题是在算法类毕业设计中比较热门的,本质上是属于自然语言分类,可以使用机器学习算法去处理,也可以使用深度学习算法去处理.基本步骤如下:文本数据采集-->选择训练算法(机器学习/深度学习)-->进行训练-->检效果.本文章博主将介绍:从头开始实践中文短文本分类运用多种机器学习(深度学习+传统机器学习)方法比较短文本分类处理过程与结果差别参与及比较算法使用下面的算法来进行
分类:其他好文   时间:2020-11-06 02:24:54    阅读次数:21
毕业设计之 --- 新闻分类系统
简介新闻分类课题是在算法类毕业设计中比较热门的,本质上是属于自然语言分类,可以使用机器学习算法去处理,也可以使用深度学习算法去处理.基本步骤如下:文本数据采集-->选择训练算法(机器学习/深度学习)-->进行训练-->检效果.本文章博主将介绍:从头开始实践中文短文本分类运用多种机器学习(深度学习+传统机器学习)方法比较短文本分类处理过程与结果差别参与及比较算法使用下面的算法来进行
分类:其他好文   时间:2020-11-06 02:24:42    阅读次数:22
利用CNN进行中文文本分类(数据集是复旦中文语料)
利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 利用RNN进行中文文本分类(数据集是复旦中文语料) 上一节我们利用了RNN(GRU)对中文文本进行了分类,本节我们将继续使用CNN对中文文本进行分类。 数据处理还是没有变,只是换了个模型,代码如下: # coding: ut ...
分类:其他好文   时间:2020-10-19 23:06:35    阅读次数:58
自然语言处理动手学Bert文本分类
自然语言处理动手学Bert文本分类Bert作为目前自然语言处理领域最流行的技术之一,文本分类作为自然语言处理领域最常见的任务之一,Pytorch作为目前最流程的深度学习框架之一,三者结合在一起将会产生什么样的花火,本套课程基于Pytorch最新1.4版本来实现利用Bert实现中文文本分类任务,延续动手学系列课程风格,全程手敲代码,跟着老师一行一行代码撸起来。章节1:课程简介章节2:Seq2Seq相
分类:编程语言   时间:2020-10-19 22:55:15    阅读次数:32
自然语言处理动手学Bert文本分类
自然语言处理动手学Bert文本分类Bert作为目前自然语言处理领域最流行的技术之一,文本分类作为自然语言处理领域最常见的任务之一,Pytorch作为目前最流程的深度学习框架之一,三者结合在一起将会产生什么样的花火,本套课程基于Pytorch最新1.4版本来实现利用Bert实现中文文本分类任务,延续动手学系列课程风格,全程手敲代码,跟着老师一行一行代码撸起来。章节1:课程简介章节2:Seq2Seq相
分类:编程语言   时间:2020-10-19 22:34:59    阅读次数:20
ImportError: cannot import name 'Tokenizer' from 'keras_bert'
今天打算用keras-bert来进行文本分类,linux系统没啥问题,但是windows系统下用pycharm报以下错误 ImportError: cannot import name 'Tokenizer' from 'keras_bert' 网上很多都是说更新kerast-bert pip in ...
分类:其他好文   时间:2020-07-30 14:35:44    阅读次数:128
Datawhale-新闻文本分类-task4-基于深度学习的文本分类1-fastText
1. fasttext 参数含义 - input # training file path (required) 训练文件路径(必须)<br> - lr # learning rate [0.1] 学习率 default 0.1<br> - dim # size of word vectors [1 ...
分类:其他好文   时间:2020-07-28 00:30:47    阅读次数:122
340条   1 2 3 4 ... 34 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!