linux下python3离线加载nltk_data，不用nltk.download()

时间：2018-11-21 12:16:33 阅读：1023 评论：0 收藏：0 [点我收藏+]

标签：token hadoop 环境搜索 har 不能 class usr directory

在不能上网的服务器上把nltk_data关联到python3，已经安装anaconda3所以不需要安装nltk，环境是linux

首先没有nltk_data在使用nltk会报错

LookupError: 
**********************************************************************
  Resource ‘tokenizers/punkt/PY3/english.pickle‘ not found.
  Please use the NLTK Downloader to obtain the resource:  >>>
  nltk.download()
  Searched in:
    - ‘/home/hadoopcj/nltk_data‘
    - ‘/usr/share/nltk_data‘
    - ‘/usr/local/share/nltk_data‘
    - ‘/usr/lib/nltk_data‘
    - ‘/usr/local/lib/nltk_data‘
    - ‘/home/hadoopcj/nltk_data‘
    - ‘‘

1.下载nltk_data

https://github.com/nltk/nltk_data

里面的Packages就是我们要的资源。
2.里面有部分是压缩包，需要解压。punkt就是，不解压即使路径对了还是会报上面的错误

3.将Packages文件夹改名为nltk_data，拷贝到服务器

4.进入python console（如输入/home/hadoopcj/anaconda3/bin/python3.6）在nltk添加你data的路径

>>>from nltk import data
>>>data.path.append(r"/home/hadoopcj/nltk_data(你的路径)")

5.查看nltk_data的搜索路径，如果有你添加的就成功了

>>> nltk.data.path

>>> nltk.data.path
[‘/home/hadoopcj/nltk_data‘, ‘/usr/share/nltk_data‘, ‘/usr/local/share/nltk_data‘, ‘/usr/lib/nltk_data‘, ‘/usr/local/lib/nltk_data‘]

To find nltk_data directory (auto-magically), see https://stackoverflow.com/a/36383314/610569
To download nltk_data to a different path, see https://stackoverflow.com/a/48634212/610569
To config nltk_data path (i.e. set a different path for NLTK to find nltk_data), see https://stackoverflow.com/a/22987374/610569

linux下python3离线加载nltk_data，不用nltk.download()

标签：token hadoop 环境搜索 har 不能 class usr directory

原文地址：https://www.cnblogs.com/34fj/p/9993842.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

linux下python3离线加载nltk_data，不用nltk.download()

Related