标签:命名 金融 文字 科技 不同的 词法分析 主题 互联网 处理
下面列举NLP接口服务的四个典型使用场景。
(1) 文本智能纠错
在智能客服的工作场景中,针对用户输入的语音信息,在语音转文本(ASR→TTS)的过程中,不可避免地会出现不少的上下文错位和措辞上的文本错误。面对这些错误,如果单纯使用人工来进行处理,会消耗大量的人力成本。这时,可以使用句法依存分析和文本纠错接口,对文本中各个语言单位之间的语义关联进行分析,同时实现对文本的自动纠错。该功能通过对文本的智能化纠错,可以高效辅助人工,有效提升语音转文字的文本质量。
除了在智能客服的用户输入检查场景中,在出版物或扫描件文档的图像转文本(OCR)场景下,也会出现类似智能客服语音转文本中的错误情形。因此,句法依存分析和文本纠错接口也可用在图像中的文字识别结果验证中。
综上所述,在智能客服的用户输入检查、图像中的文字识别结果验证、办公文档审核、文本智能质检等场景中,都有文本智能纠错的需求。因此,文本纠错和句法依存分析接口在这些场景下有广泛的应用。
(2)金融文档结构化抽取
在银行、保险、证券等金融领域和政务领域中,经常存在大量的文档和单据需要人工进行整理、提炼和归档,这些工作会花费大量的人力和时间。这时,可以使用词法分析(智能分词、词性标注、命名实体识别)、关键词提取和文本分类接口,首先对大量的金融或政务文档进行分类,然后再进行文本资料的关键信息抽取和结构化排布,可以有效地辅助人工来处理各种文档和单据,降低人力成本。
(3)网络文本内容检索
针对互联网环境或数据库中的文本数据,不同的用户存在不同的信息需求,他们会根据各自的特定需求从中搜索或检索出相应的文本资料。这时,可以使用词法分析(智能分词、词性标注、命名实体识别)和关键词提取接口,对文本的标题和内容进行核心关键词分析,提取出能够反映文本关键信息的主题、话题、实体等多维度词汇标签;然后聚合相同关键词标签的文本资料,并精准提供给进行了特定内容检索的用户,便于用户对该类型的文本资料进行全方位的信息阅读。
例如:信息流的内容搜索、万方数据库、中国知网等文献检索
(4)文章关键信息抽取和内容分析
使用词法分析(智能分词、词性标注、命名实体识别)、文本分类和关键词提取接口,首先将文章按照内容类型进行主题分类(比如该文章属于科技、娱乐、体育、财经等一级主题,AI、影视、足球、股票等二级主题),然后再对文章的标题和内容进行核心关键词提取,输出可以反映文章关键信息的多维度标签和词汇,最终达成垂直类信息资源建设、文本内容分析的目的,最大限度满足用户的各类内容和应用需求。
【快速体验链接】
腾讯云自然语言处理 API文档:https://cloud.tencent.com/document/product/271/35484
标签:命名 金融 文字 科技 不同的 词法分析 主题 互联网 处理
原文地址:https://blog.51cto.com/14569053/2446048