返回

python-需要 punkt 时如何在 Snowflake Snowpark 上运行 NLTK

发布时间:2022-06-27 23:51:41 321
# node.js

我正在使用Snowpark for Python(仍然相对较新),我想知道是否有人能够解决这个问题。我正在使用NLTK的Word Tokenize,它要求您下载punkt:

nltk.download('punkt')

在我的UDF函数中,我有:

word_token = nltk.tokenize.word_tokenize(words)

也可以在脚本中创建我正在运行的函数。我想这可能会解决问题,但似乎没有奏效。

session.add_import("punkt.py")

如果您能帮我,我将不胜感激!

雪花的错误:

raise LookupError(resource_not_found)
LookupError: 
**********************************************************************
  Resource [93mpunkt[0m not found.
  Please use the NLTK Downloader to obtain the resource:

  [31m>>> import nltk
  >>> nltk.download('punkt')
  [0m
  For more information see: https://www.nltk.org/data.html

  Attempted to load [93mtokenizers/punkt/PY3/english.pickle[0m

  Searched in:
    - '/home/udf/nltk_data'
    - '/usr/lib/python_udf/57e644a3d53ab3aac0e1c7d59fcc39d6ce41c4518a457ae5e42dcbcf413587fc/nltk_data'
    - '/usr/lib/python_udf/57e644a3d53ab3aac0e1c7d59fcc39d6ce41c4518a457ae5e42dcbcf413587fc/share/nltk_data'
    - '/usr/lib/python_udf/57e644a3d53ab3aac0e1c7d59fcc39d6ce41c4518a457ae5e42dcbcf413587fc/lib/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
    - ''
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
用户头像