何晗:HanLP:面向生产环境的自然语言处理工具包 清华:THULAC:一个高效的中文词法分析工具包 搜狗:搜狗实验室分词和词性标注 斯坦福:CORENLP 哈工大:LTP:语言技术平台(Language Technology Platform) NLPIR:NLPIR 中科大:科大讯飞 云孚科技 ...
分类:
其他好文 时间:
2020-06-26 22:09:35
阅读次数:
413
词法分析(lexical analysis):将字符序列转换为单词(Token)序列的过程 分词,命名实体识别,词性标注 并称 汉语词法分析“三姐妹”。 在线演示平台:http://ictclas.nlpir.org/nlpir/ 词性标注(Part-Of-Speech tagging, POS t ...
分类:
其他好文 时间:
2020-06-26 01:03:06
阅读次数:
93
2.1 jieba 2.1.1 jieba简介 Jieba中文含义结巴,jieba库是目前做的最好的python分词组件。首先它的安装十分便捷,只需要使用pip安装;其次,它不需要另外下载其它的数据包,在这一点上它比其余五款分词工具都要便捷。另外,jieba库支持的文本编码方式为utf-8。 Jie ...
分类:
其他好文 时间:
2020-03-31 14:23:24
阅读次数:
282
问题:使用pynlpir分词,遇到License过期问题 抛出异常:pynlpir.LicenseError: Your license appears to have expired. Try running "pynlpir update". 解决方法:下载下面链接文件,替换原有的NLPIR.u ...
分类:
其他好文 时间:
2020-03-22 16:07:20
阅读次数:
232
数据来源:http://ictclas.nlpir.org/nlpir/ (一个很牛逼的网站,上面有非常多的处理语言的功能(如分词标注、情感分析、相关词汇)) 当然这个网站还有其他的功能,像“分词标注”,就是把你输入的文本切成一个个的词,并且把这些词的词性都标出来; 还有“情感分析”的功能,就是分析 ...
分类:
其他好文 时间:
2020-01-17 13:56:15
阅读次数:
97
目前,市场上的智能客服机器人已经是一款成熟的SASS产品,90%以上的企业都可以直接接入,数据保存在云端或者机器人公司的数据库,部署非常方便。同时,对于一些大型集团公司或者金融类企业,对数据保密性要求比较高的,也可以实施落地化部署,所有数据均存放在企业本地服务器上。智能客服机器人的应用场景有哪些寒暄闲聊,有趣互动丰富的寒暄语库,贴合业务场景,模拟真人对话亲切自然。意向初筛,精准分流机器人通过消息过
分类:
其他好文 时间:
2020-01-16 16:04:04
阅读次数:
73
近几年,随着人工智能技术的深入发展及在各行各业加快落地化部署,客服行业已逐渐成为了人工智能技术众多落地应用中的重点应用场景。不少企业已经采用了智能客服机器人来替代大部分人工客服,并组建了智能化客服系统,由原来的大量人工客服模式转变为智能客服机器人+少量人工客服模式。智能客服机器人能全渠道连接客户,覆盖与客户接触的各类渠道,支持网页、QQ、H5、APP、微信公众号、微博等在线沟通,具备PC端和移动端
分类:
其他好文 时间:
2020-01-13 19:50:11
阅读次数:
105
在金融领域,NLP技术的作用主要在于自动从海量的宏观、行业、微观资讯中发现、分析并整合与各类决策相关的信息。知识图谱在金融中有多项应用,首先通过信息检索技术获取相关文本,然后借语义分析技术从非结构化文本中提取结构化的信息,最后将这些信息加以提炼,并且使之关联到未来可能的发展趋势,从而为预测和决策提供有价值的及时信息。智能金融应用是通过知识图谱相关技术从招股书、年报、公司公告、券商研究报告、新闻等半
分类:
其他好文 时间:
2020-01-04 01:13:09
阅读次数:
103
前言 中文分词有很多种,常见的比如有中科院计算所 NLPIR、哈工大 LTP、清华大学 THULAC 、斯坦福分词器、Hanlp 分词器、jieba 分词、IKAnalyzer 等。这里针对 jieba 和 HanLP 分别介绍不同场景下的中文分词应用。 jieba 分词 jieba 安装 (1)P ...
分类:
其他好文 时间:
2019-12-02 16:51:41
阅读次数:
77
首先解释下override与overload 翻译过来叫做重写和重载,笔者看来,二者的区别在两个方面表现的十分明显,首先是代码书写的区域,重载在一个类里面,重写则是子类对父类进行的重写,然后是表现优先级的不同,重写的表现优先级要高于被重写的对象,也就是说优先表现重写后的那个方法 对代码稍微做下更改, ...