performance

ruby - 有没有比 Ruby 的 Dir.glob 更快的替代品？

我正在使用Dir.glob访问与通配符模式匹配的所有文件的集合。Dir.glob('**/*.txt'){|file_name|parsefile_name}因为这个glob调用是递归的，并且因为涉及很多文件，所以glob在block开始之前需要很长时间来构建文件数组。我想要的是一种访问所有相同文件的方法，但在Ruby“发现”每个文件后立即调用block，以便立即处理第一个文件，而不是等待整个目录树完成搜索。有这样的构造吗？最佳答案您还可以使用find和IO.popenIO.popen("find.-name'*.txt'").

ruby - ruby 中的大数组操作非常慢

我有以下场景:我需要在一个非常大的集合中找出唯一的ID列表。例如，我有6000个id数组(关注者列表)，每个数组的大小范围在1到25000(他们的关注者列表)之间。我想获得所有这些ID数组中的唯一ID列表(关注者的唯一关注者)。完成后，我需要减去另一个ID列表(另一个人的关注者列表)并获得最终计数。最后一组唯一ID增长到大约60,000,000条记录。在ruby中，将数组添加到大数组时，它开始变得非常慢，大约几百万。添加到集合中一开始需要0.1秒，然后增长到200万时需要超过4秒(离我需要去的地方不远)。我用java编写了一个测试程序，它在不到一分钟的时间内完成了整个过程。也许我在

大数 ruby follower time counter performance jruby

ruby - 为什么 .index 比 .all 快？

这是做同样事情的两个简单block:a=(0..100).to_aa.all?do|x|!(x==1000)endnil==a.indexdo|x|x==1000end除了第二个总是快一点。为什么？usersystemtotalrealtestingall1.1400000.0000001.140000(1.144535)testingindex0.7700000.0000000.770000(0.769195) 最佳答案原因是index是Array的一个方法。Ruby将迭代(在C中)项目并将它们依次生成到block。另一方面，a

index ruby code section performance

ruby - proc、Proc.new、lambda 和 stabby lambda 之间的速度差异

过程和lambdadiffer关于方法范围和return关键字的效果。我对它们之间的性能差异很感兴趣。我写了一个测试，如下所示:deftime(&block)start=Time.nowblock.callp"thattook#{Time.now-start}"enddeftest(proc)time{(0..10000000).each{|n|proc.call(n)}}enddeftest_block(&block)time{(0..10000000).each{|n|block.call(n)}}enddefmethod_testtime{(1..10000000).each{|

lambda stabby 的 block test ruby performance proc

ruby - 导轨 4 : why is one way of rendering partials so much faster?

我不确定这是否是Rails特有的问题，因此我也将其标记为ruby。我正在通过部分呈现一组event记录。但是，我发现以不同方式渲染部分会导致性能差异显着。两个版本使用完全相同的数据，唯一不同的是用于渲染局部的代码。为什么一个版本总是比另一个版本快4倍？让我想知道我正在接受哪些其他性能影响......慢速版本(总请求时间950毫秒):#LogoutputRenderedevents/_event.html.erb(1.1ms)Renderedevents/_event.html.erb(1.1ms)...更快的版本(总请求时间为250毫秒):#LogoutputRenderedevent

rendering partials event section events ruby performance ruby-on-rails-4

ruby-on-rails - 如何分析 Rails 应用程序的启动？

简单的问题，我有一个遗留的Rails2.3应用程序，它需要很长时间才能完成任何事情。rake花费了超过25秒，但看起来并没有真正发生任何事情。有什么简单的方法可以让我从应用程序加载时获取某种探查器转储，以查看哪些方法花费的时间最长？同时适用于Rails2.3和3.1的解决方案会更有帮助。最佳答案分析一个需要rails环境的rake任务，像这样:desc"Loadit"task:loadit=>:environmentdoend然后使用ruby-prof配置文件ruby-Ilib-Sruby-prof-pgraph_html`

ruby-on-rails Rails section code 何事 ruby performance profiling

ruby如何生成一个树形结构形式的数组？

我有一个数组，其中包含这样的项目列表arr=[{:id=>1,:title=>"A",:parent_id=>nil},{:id=>2,:title=>"B",:parent_id=>nil},{:id=>3,:title=>"A1",:parent_id=>1},{:id=>4,:title=>"A2",:parent_id=>1},{:id=>5,:title=>"A11",:parent_id=>3},{:id=>6,:title=>"12",:parent_id=>3},{:id=>7,:title=>"A2=121",:parent_id=>6},{:id=>8,:title

树形 ruby gt parent_id parent arrays performance algorithm tree

ruby - 针对每一行的多个(15+)正则表达式解析文本正文的最佳方法是什么？

我有一段文本需要扫描，每行至少包含2部分信息，有时包含4部分信息。问题是每一行可能是15-20种不同操作中的一种。在ruby中，当前代码看起来像这样:text.split("\n").eachdo|line|#around20times................expressions['actions'].eachdo|pat,reg|#around20times.................这显然是“问题所在”。通过将所有正则表达式合并为一个，我确实设法使其更快(在C++中提高了50%)，但这仍然不是我需要的速度——我需要快速解析数千个这些文件!现在我将它们与正则表达式

ruby amp section noreferrer noopener regex performance parsing peg

ruby-on-rails - ruby 中集合操作与数组操作的效率

集合和数组在运算效率上有何不同？例子:查找迭代包括？最佳答案在Ruby中，Set是使用底层的Hash编写的，它通常应该与Hash等效。因此:include?:集合复杂度为O(1)，数组复杂度为O(n)枚举:两者都是O(n)删除:集合复杂度为O(1)，数组复杂度为O(n)...等等如果您所说的“查找”是指按索引查找，我会注意到默认的Set实现是无序的，因此它不像数组那样支持该操作。关于ruby-on-rails-ruby中集合操作与数组操作的效率，我们在StackOverflow上找

中集 ruby section code li ruby-on-rails performance

ruby - Ruby 字符串字典中的快速模糊/近似搜索

我有一个包含50K到100K字符串的字典(最多可以包含50个以上的字符)，我正在尝试查找给定字符串是否在具有“编辑”距离公差的字典中。(例如Levenshtein)。在进行搜索之前，我可以预先计算任何类型的数据结构。我的目标是尽快针对该字典运行数千个字符串并返回最近的邻居。如果有一个明显更快的算法，我会得到一个bool值来说明给定的是否在字典中为此，我首先尝试计算所有Levenshtein距离并取最小值，这显然非常慢。所以我尝试根据这篇文章实现一个LevenshteinTriehttp://stevehanov.ca/blog/index.php?id=114在这里查看我的重现基准的要

近似 ruby section noreferrer noopener performance algorithm levenshtein-distance fuzzy-search

2 3 456 7 8