短语_JJZJJ

python - 使用Python从nltk树结构中提取特定的叶子值

我对NLTK的树函数有一些疑问。我正在尝试从树结构中提取某个单词，如下所示。test=Tree.parse('(ROOT(SBARQ(WHADVP(WRBHow))(SQ(VBPdo)(NP(PRPyou))(VP(VBask)(NP(DTa)(JJtotal)(NNstranger))(PRT(RPout))(PP(INon)(NP(DTa)(NNdate)))))))')print"Inputtree:",testprinttest.leaves()(SBARQ(WHADVP(WRBHow))(SQ(VBPdo)(NP(PRPyou))(VP(VBask)(NP(DTa)(JJto

python code 39 短语 tree nltk

python - NLTK:如何遍历名词短语以返回字符串列表？

在NLTK中，如何遍历已解析的句子以返回名词短语字符串列表？我有两个目标:(1)创建名词短语列表，而不是使用“traverse()”方法打印它们。我目前使用StringIO来记录现有traverse()方法的输出。这不是一个可接受的解决方案。(2)反解析名词短语字符串，这样:'(NPMichael/NNPJackson/NNP)'变成'MichaelJackson'。NLTK中有反解析的方法吗？NLTK文档建议使用traverse()来查看名词短语，但是如何在这种递归方法中捕获“t”以便生成字符串名词短语列表？fromnltk.tagimportpos_tagdeftraverse(t

短语 python section tagged_sent parsing recursion nltk traversal

python - 将字符串拆分为所有可能的有序短语

我正在尝试探索Python内置函数的功能。我目前正在尝试处理一些需要字符串的东西，例如:'thefastdog'并将字符串分解为所有可能的有序短语，作为列表。上面的示例将输出如下:[['the','fastdog'],['thefast','dog'],['the','fast','dog']]关键是在生成可能的短语时需要保留字符串中单词的原始顺序。我已经能够使用一个函数来执行此操作，但它相当笨重且丑陋。但是，我想知道Python中的某些内置功能是否有用。我在想，有可能在不同的空白处拆分字符串，然后递归地将其应用于每个拆分。可能有人有一些建议吗？最佳答案

短语有序 39 fast dog python string list

python - 打印给定字符串中所有可能的短语(单词的连续组合)

我正在尝试打印给定文本中的短语。我希望能够打印文本中的每个短语，从2个单词到文本长度允许的最大单词数。我在下面编写了一个程序，它打印所有长度最多为5个单词的短语，但我无法找到更优雅的方法来让它打印所有可能的短语。我对phrase的定义=字符串中的连续单词，不管是什么意思。defphrase_builder(i):phrase_length=4phrase_list=[]forxinrange(0,len(i)-phrase_length):phrase_list.append(str(i[x])+""+str(i[x+1]))phrase_list.append(str(i[x])+"

给定短语 39 the sits python

python - 在某个短语后切割字符串？

我有一批字符串需要删减。它们基本上是一个描述符，后面跟着代码。我只想保留描述符。'adescriptordps23fd''another23fd''andanotherfd''andonewithoutacode'上面的代码是dps、23和fd。它们可以以任何顺序出现，彼此无关并且可能根本不存在(如最后一种情况)。代码列表是固定的(或者至少可以预测)，因此假设代码从未在合法描述符中使用，我如何在代码的第一个实例之后剥离所有内容。我正在使用Python。最佳答案简短的回答，正如@THC4K在评论中指出的那样:string.spli

短语 python code gt descriptor

html - 元关键字 - 使用单词或短语？

我知道元关键字的相关性很小甚至没有，但我的客户需要它们。此外，他们给了我一个关键短语列表。我应该插入以逗号分隔的关键短语，即使它们重复某些关键字，还是应该只包含每个关键字一次，根本不使用短语？或最佳答案使用完整的短语。否则，当使用精确的短语进行搜索时，您的客户将不会对您满意。关于html-元关键字-使用单词或短语？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/570842

短语单词 section 关键 html meta-tags keyword

html - 元关键字 - 使用单词或短语？

我知道元关键字的相关性很小甚至没有，但我的客户需要它们。此外，他们给了我一个关键短语列表。我应该插入以逗号分隔的关键短语，即使它们重复某些关键字，还是应该只包含每个关键字一次，根本不使用短语？或最佳答案使用完整的短语。否则，当使用精确的短语进行搜索时，您的客户将不会对您满意。关于html-元关键字-使用单词或短语？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/570842

短语单词 section 关键 html meta-tags keyword

ES multiMatchQuery 短语精确匹配多个字段

multiMatchQuery用于匹配多个字段，但是会对搜索关键字进行分词但是有时候需要精确匹配（也就是对搜索关键字不分词）多个字段。怎么办呢答案是用这个multiMatchQuery方法进行查询。但是要指定type##multi_match查询的类型multi_match:查询内部到底如何执行主要取决于它的type参数，这个参数的可取得值如下best_fields:是默认类型，会将任何与查询匹配的文档作为结果返回，但是只使用最佳字段的_score评分作为评分结果返回。most_fields:将任何与查询匹配的文档作为结果返回，并所有匹配字段的评分合并起来phrase:在fields中的每个字

字段 multiMatchQuery span class token elasticsearch

redis - redis中键的短语匹配

我在redis中有以下键:"542136mountainroad""542136mountainviewroad""542136mountainroad""542136mountain""136mountainroad""136mountain"我想获取包含短语136mountain的key。使用glob样式模式，我目前正在进行4个查询以满足所有可能的情况。scan0MATCH'*[\]136mountain[\]*'scan0MATCH'*[\]136mountain'scan0MATCH'136mountain[\]*'scan0MATCH'136mountain'这四个查询总共会

redis 短语 strong mountain 136 pattern-matching glob

redis - redis中键的短语匹配

我在redis中有以下键:"542136mountainroad""542136mountainviewroad""542136mountainroad""542136mountain""136mountainroad""136mountain"我想获取包含短语136mountain的key。使用glob样式模式，我目前正在进行4个查询以满足所有可能的情况。scan0MATCH'*[\]136mountain[\]*'scan0MATCH'*[\]136mountain'scan0MATCH'136mountain[\]*'scan0MATCH'136mountain'这四个查询总共会

redis 短语 strong mountain 136 pattern-matching glob