jjzjj

java - 如何用java获取句子的逻辑部分?

coder 2024-03-22 原文

假设有一句话:

On March 1, he was born.

将其更改为

He was born on March 1.

没有破坏句子的意思,它仍然有效。以任何其他方式改组单词会产生奇怪的无效句子。所以基本上,我说的是句子的某些部分,它们使信息更具体,但删除它们并不会破坏整个句子。是否有任何 NLP 库可以识别这些部分?

最佳答案

成分

听起来您想识别句子的 constituents ,它们是根据语言语法作为单个单元运行的词组。

事实上,当语言学家试图发现一种语言的语法时,他们部分地通过查看 movement 来做到这一点。 .在您的示例中,这就是一组单词可以移动到句子中不同位置的地方,同时仍保留句子的含义。

成分可以是单个单词、短语,甚至是更大的组,例如整个子句。在一个句子中,它们具有嵌套的层次结构。比如你给出的第一个例句可以分析为:

(S  (PP (IN On) (NP (NNP March) (CD 1)))
    (NP (PRP he))
    (VP (VBD was) (VP (VBN born))))

整个句子由prepositional phrase组成, 其次是 noun phrase , 然后是 verb phrase .介词短语可以进一步分解为由单个单词“On”和后跟一个名词短语组成的单元。

短语结构解析器

要自动查找成分,您可能需要使用短语结构解析器。有许多可供选择的开源解析,包括:

Stanford 和 Berkeley 解析器可能是最容易安装和使用的。如 Cer et al. 2010 中所示,最准确的解析器是 Berkeley 和 Charniak。 Bikel 解析器比其他解析器更慢且更不准确。

在线演示

斯坦福解析器有一个在线演示 here .我使用演示生成了上面给出的例句的解析。

关于删除的注意事项

在每个成分中,都会有一个 head word .例如,以名词短语为例:

(NP (DT The) (JJ big) (JJ blue) (NN ball))

这里的中心词是名词ball,被形容词bigblue修饰。如果这个名词短语被嵌入到一个句子中,你可以删除那些修饰语,并且仍然有一些与原始句子的意思一致但不那么具体的东西。

在名词短语中,一般可以删除形容词、非中心名词和嵌套的介词短语。

在动词短语和完整的从句中,事情变得更加棘手,因为删除作为动词论元的 Material 可以完全改变句子的解释。例如,从 He sold Jim the book 中删除 the book 会导致 He sold Jim

关于java - 如何用java获取句子的逻辑部分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2699646/

有关java - 如何用java获取句子的逻辑部分?的更多相关文章

  1. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  2. ruby - 简单获取法拉第超时 - 2

    有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url

  3. ruby - 从 Ruby 中的主机名获取 IP 地址 - 2

    我有一个存储主机名的Ruby数组server_names。如果我打印出来,它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点,但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类?输出:ge

  4. ruby - 获取模块中定义的所有常量的值 - 2

    我想获取模块中定义的所有常量的值:moduleLettersA='apple'.freezeB='boy'.freezeendconstants给了我常量的名字:Letters.constants(false)#=>[:A,:B]如何获取它们的值的数组,即["apple","boy"]? 最佳答案 为了做到这一点,请使用mapLetters.constants(false).map&Letters.method(:const_get)这将返回["a","b"]第二种方式:Letters.constants(false).map{|c

  5. ruby-on-rails - 获取 inf-ruby 以使用 ruby​​ 版本管理器 (rvm) - 2

    我安装了ruby​​版本管理器,并将RVM安装的ruby​​实现设置为默认值,这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时,它使用安装在/usr/bin中的ruby​​。有没有办法让emacs像shell一样尊重ruby​​的路径?谢谢! 最佳答案 我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣,可以在这里获取:http://github.com/senny/rvm.el

  6. Ruby 从大范围中获取第 n 个项目 - 2

    假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目? 最佳答案 一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做,或者如果你需要避免为前N个元素构建中间数组,你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit

  7. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  8. ruby - Net::HTTP 获取源代码和状态 - 2

    我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur

  9. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  10. ruby - 没有类方法获取 Ruby 类名 - 2

    如何在Ruby中获取BasicObject实例的类名?例如,假设我有这个:classMyObjectSystem我怎样才能使这段代码成功?编辑:我发现Object的实例方法class被定义为returnrb_class_real(CLASS_OF(obj));。有什么方法可以从Ruby中使用它? 最佳答案 我花了一些时间研究irb并想出了这个:classBasicObjectdefclassklass=class这将为任何从BasicObject继承的对象提供一个#class您可以调用的方法。编辑评论中要求的进一步解释:假设你有对象

随机推荐