jjzjj

python - 将 Spacy Parser 应用于具有多处理功能的 Pandas DataFrame

假设我有一个数据集,比如iris=pd.DataFrame(sns.load_dataset('iris'))我可以使用Spacy和.apply将字符串列解析为标记(我的真实数据集当然每个条目有>1个单词/标记)importspacy#(Ihaveversion1.8.2)nlp=spacy.load('en')iris['species_parsed']=iris['species'].apply(nlp)结果:sepal_length...speciesspecies_parsed01.4...setosa(setosa)11.4...setosa(setosa)21.3...se

python - SpaCy:如何获取 spacy 模型名称?

它没有出现在piplistzeke$piplist|grepspacyspacy(1.7.3)如何获取模型名称?我试过了,还是不行echo"spaCymodel:"python3-msputnik--namespacyfind抛出这个错误:zeke$python3-msputnik--namespacyfindTraceback(mostrecentcalllast):File"/Users/zeke/anaconda/lib/python3.5/runpy.py",line193,in_run_module_as_main"__main__",mod_spec)File"/Users

python - 如何使用 spacy lemmatizer 将单词转换为基本形式

我是spacy的新手,我想使用它的lemmatizer功能,但我不知道如何使用它,就像我进入单词字符串一样,它将以单词的基本形式返回字符串。例子:'单词'=>'单词''做过'=>'做'谢谢。 最佳答案 上一个答案很复杂,无法编辑,所以这里是一个更传统的答案。#makesureyourdownloadedtheenglishmodelwith"python-mspacydownloaden"importspacynlp=spacy.load('en')doc=nlp(u"Applesandorangesaresimilar.Boots

python - SpaCy:如何加载 Google 新闻 word2vec 向量?

我尝试了几种加载谷歌新闻word2vec向量(https://code.google.com/archive/p/word2vec/)的方法:en_nlp=spacy.load('en',vector=False)en_nlp.vocab.load_vectors_from_bin_loc('GoogleNews-vectors-negative300.bin')以上给出:MemoryError:Errorassigning18446744072820359357bytes我也尝试过使用.gz压缩向量;或使用gensim加载并保存它们为新格式:fromgensim.models.wor

python - Spacy链接错误

运行时:importspacynlp=spacy.load('en')打印以下内容:Warning:nomodelfoundfor'en'Onlyloadingthe'en'tokenizer./site-packages/spacy/data为空,但init文件除外。所有文件路径都只指向我的单个python安装。对解决此问题的任何帮助表示赞赏。谢谢!会 最佳答案 我在Windows10上尝试此操作时遇到了同样的问题-问题是python-mspacy.en.downloadall的输出说Linkingsuccessful但在上面那是

python - spaCy 的词性和依赖标签是什么意思?

spaCy使用词性标记Token中的每个Document(有两种不同的格式,一种存储在pos的pos_和Token属性中,另一种存储在tag和tag_属性)以及对其.head标记的语法依赖(存储在dep和dep_属性中)。其中一些标签是不言自明的,即使是像我这样没有语言学背景的人:>>>importspacy>>>en_nlp=spacy.load('en')>>>document=en_nlp("IshotamaninRenojusttowatchhimdie.")>>>document[1]shot>>>document[1].pos_'VERB'其他……不是:>>>documen

python - 使用 spacy 添加/删除自定义停用词

使用spacy添加/删除停用词的最佳方法是什么?我正在使用token.is_stop功能,并希望对集合进行一些自定义更改。我正在查看文档,但找不到任何关于停用词的信息。谢谢! 最佳答案 使用Spacy2.0.11,您可以使用以下方法之一更新其停用词集:添加单个停用词:importspacynlp=spacy.load("en")nlp.Defaults.stop_words.add("my_new_stopword")一次添加多个停用词:importspacynlp=spacy.load("en")nlp.Defaults.stop

python - 如何使用 spaCy 获取依赖树?

我一直试图找到如何使用spaCy获取依赖树,但我找不到任何关于如何获取树的信息,只能在howtonavigatethetree上找到。. 最佳答案 如果有人想轻松查看spacy生成的依赖树,一种解决方案是将其转换为nltk.tree.Tree并使用nltk.tree.Tree.pretty_print方法。这是一个例子:importspacyfromnltkimportTreeen_nlp=spacy.load('en')doc=en_nlp("Thequickbrownfoxjumpsoverthelazydog.")defto_