码迷,mamicode.com
首页 > 编程语言 > 详细

Hanlp 在Python环境中安装、介绍及使用

时间:2018-11-04 01:40:20      阅读:279      评论:0      收藏:0      [点我收藏+]

标签:tde   中文分词   位置   art   git   文件的   strong   分词   get   

Hanlp
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然
语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构
清晰、语料时新、可自定义的特点。
功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取
新词发现 短语提取 自动摘要 文本分类 拼音简繁

 

Hanlp环境安装
? 1、安装Java和Visual C++:我装的是Java 1.8和Visual C++ 2015。
? 2、安裝Jpype,conda install -c conda-forge jpype1
? 3、测试是否按照成功:
from jpype import *
startJVM(getDefaultJVMPath(), "-ea")
java.lang.System.out.println("Hello World")
shutdownJVM()

 

Hanlp安装
? 1)下载hanlp.jar包: https://github.com/hankcs/HanLP
? 2、下载data.zip:https://github.com/hankcs/HanLP/releases中
http://hanlp.linrunsoft.com/release/data-for-1.7.0.zip后解压数据
包。
? 3、配置文件
? 示例配置文件:hanlp.properties
? 配置文件的作用是告诉HanLP数据包的位置,只需修改第一行:
root=usr/home/HanLP/
? 比如data目录是/Users/hankcs/Documents/data,那么
root=/Users/hankcs/Documents/

Hanlp 在Python环境中安装、介绍及使用

标签:tde   中文分词   位置   art   git   文件的   strong   分词   get   

原文地址:https://www.cnblogs.com/wangliman/p/9902635.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!