BERT 预训练模型及文本分类 介绍 如果你关注自然语言处理技术的发展,那你一定听说过 BERT,它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验将介绍 BERT 的模型结构,以及将其应用于文本分类实践。 知识点 语言模型和词向量 BERT 结构详解 BERT 文本分类 "BERT" 全称为 ...
分类:
其他好文 时间:
2020-02-08 17:37:21
阅读次数:
96
概念 统计语言模型是NLP的基础,是描述自然语言内在的规律的数学模型。广泛应用于各种自然语言处理问题,如语音识别、机器翻译、分词、词性标注等。 简单地说,统计语言模型就是给定一个句子W(由多个单词w1,w2,w3...组成),计算该句子可信(合理)的概率的模型,即$P(W)=P(w_1,w_2,w_ ...
分类:
编程语言 时间:
2020-02-07 16:29:54
阅读次数:
63
软件需求规格说明是对分析和综合过程的结果描述,它包含了软件的功能、性能、接口、有效性等需求的描述信息。通常,描述需求规格说明的语言主要分为自然语言、形式化需求描述语言、结构化语言 引言 1.1 编写目的 · 阐明开发本软件的目的; 1.2 项目背景 · 标识待开发软件产品的名称、代码; · 列出本项 ...
分类:
其他好文 时间:
2020-02-07 10:31:59
阅读次数:
96
人工智能(Artificial Intelligence) 通过计算机模拟人类智慧,以完成很多只有人类才可以完成,甚至连人类都无法完成的任务 比如专家系统、图像识别、语音识别、自然语言处理、自动驾驶、推荐系统、人机博弈、电脑游戏、机器人等 人类利用计算机完成了很多对人类而言非常困难的工作,但一些人类 ...
分类:
其他好文 时间:
2020-02-06 11:06:33
阅读次数:
84
深度学习在很多机器学习领域均有非常出色的表现,在图像识别、语音识别、自然语言处理、机器人、网络广告投放、医学自动诊断和金融等各大领域有着广泛的应用。面对繁多的应用场景,深度学习框架可以节省大量而繁琐的外围工作,使建模者关注业务场景和模型设计本身。 使用深度学习框架完成建模任务有两个显著优势。 节省大 ...
分类:
其他好文 时间:
2020-02-04 13:49:54
阅读次数:
99
jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 ...
分类:
其他好文 时间:
2020-02-02 19:31:12
阅读次数:
108
今天学习自然语言的算法 TF-IDF 算法 :关键词提取 TF-IDF的主要思想就是:如果某个词在一篇文档中出现的频率高,也就是TF高;在语料库中其他的文档中很少出现,就是DF低,也就是IDF高,则认为这个词具有很好的类区分能力。 TF为词频(Term Frequency),表示词t在文档d中出现的 ...
分类:
其他好文 时间:
2020-02-02 00:59:39
阅读次数:
86
题链 tips: 1.倒序存储 2.进位、借位处理t 3.去除前导零 4.c++11新语法auto 5.A4A3A2A1A0(自然语言与代码存储相结合) 6.压位处理? //加法 #include<iostream> #include<vector> #include<cstdio> using n ...
分类:
其他好文 时间:
2020-01-31 21:00:27
阅读次数:
65
一、NER简介 NER又称作专名识别,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。NER包含以下model: 3 class model : Location, Person, Org ...
分类:
其他好文 时间:
2020-01-29 20:03:36
阅读次数:
270
词性标注(Part-of-Speech tagging 或 POS tagging)是指对于句子中的每个词都指派一个合适的词性,也就是要确定每个词是名词、动词、形容词或其他词性的过程,又称词类标注或者简称标注。 对于输入句子: The Fulton County Grand Jury said Fr ...
分类:
编程语言 时间:
2020-01-22 18:32:15
阅读次数:
92