jjzjj

airgapped

全部标签

python - 在 airgapped 环境中安装 nltk 数据

我想通过Pyspark在hadoop集群上利用NLTK执行NLP任务。我们使用Anaconda发行版。集群处于气隙环境中,因此我无法运行nltk.download()。我想我需要将数据下载到可以访问互联网的辅助机器上。我从哪里下载它?以及如何将它安装在hadoop集群上?我只是复制文件吗?或者nltk是否需要知道数据在哪里?是否需要在所有节点上复制数据? 最佳答案 WheredoIdownloaditfrom?您可以在您的机器上执行nltk.download(),数据将下载到您的主目录下的文件夹nltk_dataAndhowdoIi