码迷,mamicode.com
首页 > 编程语言 > 详细

linux下python3离线加载nltk_data,不用nltk.download()

时间:2018-11-21 12:16:33      阅读:1023      评论:0      收藏:0      [点我收藏+]

标签:token   hadoop   环境   搜索   har   不能   class   usr   directory   

在不能上网的服务器上把nltk_data关联到python3,已经安装anaconda3所以不需要安装nltk,环境是linux

首先没有nltk_data在使用nltk会报错

LookupError: 
**********************************************************************
  Resource tokenizers/punkt/PY3/english.pickle not found.
  Please use the NLTK Downloader to obtain the resource:  >>>
  nltk.download()
  Searched in:
    - /home/hadoopcj/nltk_data
    - /usr/share/nltk_data
    - /usr/local/share/nltk_data
    - /usr/lib/nltk_data
    - /usr/local/lib/nltk_data
    - /home/hadoopcj/nltk_data
    - ‘‘

1.下载nltk_data

https://github.com/nltk/nltk_data

里面的Packages就是我们要的资源。
2.里面有部分是压缩包,需要解压。punkt就是,不解压即使路径对了还是会报上面的错误

3.将Packages文件夹改名为nltk_data,拷贝到服务器

4.进入python console(如输入/home/hadoopcj/anaconda3/bin/python3.6)在nltk添加你data的路径

>>>from nltk import data
>>>data.path.append(r"/home/hadoopcj/nltk_data(你的路径)")

5.查看nltk_data的搜索路径,如果有你添加的就成功了

>>> nltk.data.path
>>> nltk.data.path
[/home/hadoopcj/nltk_data, /usr/share/nltk_data, /usr/local/share/nltk_data, /usr/lib/nltk_data, /usr/local/lib/nltk_data]

 

Related

 

 

linux下python3离线加载nltk_data,不用nltk.download()

标签:token   hadoop   环境   搜索   har   不能   class   usr   directory   

原文地址:https://www.cnblogs.com/34fj/p/9993842.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!