jjzjj

java - 支持快速第k大元素查找的队列数据结构

coder 2023-05-18 原文

我遇到了一个问题,需要一个支持快速第 k 个最大元素查找的队列数据结构。

这个数据结构的要求如下:

  1. 队列中的元素不一定是整数,但它们必须是相互可比的,即我们可以通过比较两个元素来判断哪个更大(它们也可以相等)。

  2. 数据结构必须支持入队(添加尾部元素)和出队(移除头部元素)。

  3. 可以快速找到队列中第k大的元素,请注意k不是常数。

  4. 您可以假设操作 enqueue 、 dequeue 和第 k 个最大元素查找都以相同的频率发生。

我的想法是使用修改后的平衡二叉搜索树。该树与普通平衡二叉搜索树相同,只是每个节点i都增加了另一个字段ni,ni表示数字根节点i 的子树中包含的节点数。上述操作支持如下:

为简单起见,假设所有元素都是不同的。

Enqueue(x):x首先插入到树中,假设对应的节点是nodet,我们追加pair(x,pointer to node t) 到队列中。

Dequeue:假设(e1, node1)是头部元素,node1是指向对应的树的指针e1。我们从树中删除 node1 并从队列中移除 (e1, node1)。

K-th最大元素查找:假设根节点是noderoot,它的两个子节点是nodeleft和noderight (假设都存在),我们比较 K 和 nroot ,可能会出现三种情况:

  1. 如果 K<>left 我们在 nroot 的左子树中找到第 K 个最大的元素;

  2. 如果 K>nroot-nright 我们找到 (K-nroot+nright)-nroot的右子树中的最大元素;

  3. 否则nroot就是我们想要的节点。

这三个操作的时间复杂度都是 O(logN) ,其中 N 是当前队列中的元素个数。

如何加快上述操作?使用什么数据结构以及如何使用?

最佳答案

注意 - 你不可能比 O(logn) 更好,充其量你需要“选择”你最关心的操作。 (否则,您可以通过将数组提供给 DS 并查询第 1、2、3、... n 个元素,以 O(n) 进行排序)

  • 使用 skip list而不是平衡的 BST 作为排序结构 可以将出队复杂度降低O(1) 平均情况。它确实 不影响任何其他操作的复杂性。
    要从跳过列表中删除 - 您需要做的就是使用队列头部的指针到达元素,然后沿着链接向上并删除每个链接。预计需要删除的节点数为 1 + 1/2 + 1/4 + ... = 2。
  • find Kth 可以在 O(logK) 中实现,方法是从最左边的节点(而不是根节点)开始,一直向上直到找到“然后需要更多的儿子”,然后将刚刚找到的节点视为根,就像问题中的算法一样。虽然它在渐近复杂度方面更好 - 常数因子是双倍的。

关于java - 支持快速第k大元素查找的队列数据结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12532060/

有关java - 支持快速第k大元素查找的队列数据结构的更多相关文章

  1. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  2. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  3. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  4. ruby - 当使用::指定模块时,为什么 Ruby 不在更高范围内查找类? - 2

    我刚刚被困在这个问题上一段时间了。以这个基地为例:moduleTopclassTestendmoduleFooendend稍后,我可以通过这样做在Foo中定义扩展Test的类:moduleTopmoduleFooclassSomeTest但是,如果我尝试通过使用::指定模块来最小化缩进:moduleTop::FooclassFailure这失败了:NameError:uninitializedconstantTop::Foo::Test这是一个错误,还是仅仅是Ruby解析变量名的方式的逻辑结果? 最佳答案 Isthisabug,or

  5. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  6. ruby - 查找字符串中的内容类型(数字、日期、时间、字符串等) - 2

    我正在尝试解析一个CSV文件并使用SQL命令自动为其创建一个表。CSV中的第一行给出了列标题。但我需要推断每个列的类型。Ruby中是否有任何函数可以找到每个字段中内容的类型。例如,CSV行:"12012","Test","1233.22","12:21:22","10/10/2009"应该产生像这样的类型['integer','string','float','time','date']谢谢! 最佳答案 require'time'defto_something(str)if(num=Integer(str)rescueFloat(s

  7. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  8. ruby - 是否有用于序列化和反序列化各种格式的对象层次结构的模式? - 2

    给定一个复杂的对象层次结构,幸运的是它不包含循环引用,我如何实现支持各种格式的序列化?我不是来讨论实际实现的。相反,我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby,我想解析XML和JSON数据以构建复杂的对象层次结构。此外,应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗?在任何提到的情况下,我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好,这样我以后就可以轻松支持多种XML格式。 最佳答案 我最

  9. ruby - 分布式事务和队列,ruby,erlang,scala - 2

    我有一个涉及多台机器、消息队列和事务的问题。因此,例如用户点击网页,点击将消息发送到另一台机器,该机器将付款添加到用户的帐户。每秒可能有数千次点击。事务的所有方面都应该是容错的。我以前从未遇到过这样的事情,但一些阅读表明这是一个众所周知的问题。所以我的问题。我假设安全的方法是使用两阶段提交,但协议(protocol)是阻塞的,所以我不会获得所需的性能,我是否正确?我通常写Ruby,但似乎Redis之类的数据库和Rescue、RabbitMQ等消息队列系统对我的帮助不大——即使我实现某种两阶段提交,如果Redis崩溃,数据也会丢失,因为它本质上只是内存。所有这些让我开始关注erlang和

  10. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

随机推荐