jjzjj

performance

全部标签

ruby - 有没有比 Ruby 的 Dir.glob 更快的替代品?

我正在使用Dir.glob访问与通配符模式匹配的所有文件的集合。Dir.glob('**/*.txt'){|file_name|parsefile_name}因为这个glob调用是递归的,并且因为涉及很多文件,所以glob在block开始之前需要很长时间来构建文件数组。我想要的是一种访问所有相同文件的方法,但在Ruby“发现”每个文件后立即调用block,以便立即处理第一个文件,而不是等待整个目录树完成搜索。有这样的构造吗? 最佳答案 您还可以使用find和IO.popenIO.popen("find.-name'*.txt'").

ruby - ruby 中的大数组操作非常慢

我有以下场景:我需要在一个非常大的集合中找出唯一的ID列表。例如,我有6000个id数组(关注者列表),每个数组的大小范围在1到25000(他们的关注者列表)之间。我想获得所有这些ID数组中的唯一ID列表(关注者的唯一关注者)。完成后,我需要减去另一个ID列表(另一个人的关注者列表)并获得最终计数。最后一组唯一ID增长到大约60,000,000条记录。在ruby​​中,将数组添加到大数组时,它开始变得非常慢,大约几百万。添加到集合中一开始需要0.1秒,然后增长到200万时需要超过4秒(离我需要去的地方不远)。我用java编写了一个测试程序,它在不到一分钟的时间内完成了整个过程。也许我在

ruby - 为什么 .index 比 .all 快?

这是做同样事情的两个简单block:a=(0..100).to_aa.all?do|x|!(x==1000)endnil==a.indexdo|x|x==1000end除了第二个总是快一点。为什么?usersystemtotalrealtestingall1.1400000.0000001.140000(1.144535)testingindex0.7700000.0000000.770000(0.769195) 最佳答案 原因是index是Array的一个方法。Ruby将迭代(在C中)项目并将它们依次生成到block。另一方面,a

ruby - proc、Proc.new、lambda 和 stabby lambda 之间的速度差异

过程和lambdadiffer关于方法范围和return关键字的效果。我对它们之间的性能差异很感兴趣。我写了一个测试,如下所示:deftime(&block)start=Time.nowblock.callp"thattook#{Time.now-start}"enddeftest(proc)time{(0..10000000).each{|n|proc.call(n)}}enddeftest_block(&block)time{(0..10000000).each{|n|block.call(n)}}enddefmethod_testtime{(1..10000000).each{|

ruby - 导轨 4 : why is one way of rendering partials so much faster?

我不确定这是否是Rails特有的问题,因此我也将其标记为ruby。我正在通过部分呈现一组event记录。但是,我发现以不同方式渲染部分会导致性能差异显着。两个版本使用完全相同的数据,唯一不同的是用于渲染局部的代码。为什么一个版本总是比另一个版本快4倍?让我想知道我正在接受哪些其他性能影响......慢速版本(总请求时间950毫秒):#LogoutputRenderedevents/_event.html.erb(1.1ms)Renderedevents/_event.html.erb(1.1ms)...更快的版本(总请求时间为250毫秒):#LogoutputRenderedevent

ruby-on-rails - 如何分析 Rails 应用程序的启动?

简单的问题,我有一个遗留的Rails2.3应用程序,它需要很长时间才能完成任何事情。rake花费了超过25秒,但看起来并没有真正发生任何事情。有什么简单的方法可以让我从应用程序加载时获取某种探查器转储,以查看哪些方法花费的时间最长?同时适用于Rails2.3和3.1的解决方案会更有帮助。 最佳答案 分析一个需要rails环境的rake任务,像这样:desc"Loadit"task:loadit=>:environmentdoend然后使用ruby​​-prof配置文件ruby-Ilib-Sruby-prof-pgraph_html`

ruby如何生成一个树形结构形式的数组?

我有一个数组,其中包含这样的项目列表arr=[{:id=>1,:title=>"A",:parent_id=>nil},{:id=>2,:title=>"B",:parent_id=>nil},{:id=>3,:title=>"A1",:parent_id=>1},{:id=>4,:title=>"A2",:parent_id=>1},{:id=>5,:title=>"A11",:parent_id=>3},{:id=>6,:title=>"12",:parent_id=>3},{:id=>7,:title=>"A2=121",:parent_id=>6},{:id=>8,:title

ruby - 针对每一行的多个(15+)正则表达式解析文本正文的最佳方法是什么?

我有一段文本需要扫描,每行至少包含2部分信息,有时包含4部分信息。问题是每一行可能是15-20种不同操作中的一种。在ruby​​中,当前代码看起来像这样:text.split("\n").eachdo|line|#around20times................expressions['actions'].eachdo|pat,reg|#around20times.................这显然是“问题所在”。通过将所有正则表达式合并为一个,我确实设法使其更快(在C++中提高了50%),但这仍然不是我需要的速度——我需要快速解析数千个这些文件!现在我将它们与正则表达式

ruby-on-rails - ruby 中集合操作与数组操作的效率

集合和数组在运算效率上有何不同?例子:查找迭代包括? 最佳答案 在Ruby中,Set是使用底层的Hash编写的,它通常应该与Hash等效。因此:include?:集合复杂度为O(1),数组复杂度为O(n)枚举:两者都是O(n)删除:集合复杂度为O(1),数组复杂度为O(n)...等等如果您所说的“查找”是指按索引查找,我会注意到默认的Set实现是无序的,因此它不像数组那样支持该操作。 关于ruby-on-rails-ruby中集合操作与数组操作的效率,我们在StackOverflow上找

ruby - Ruby 字符串字典中的快速模糊/近似搜索

我有一个包含50K到100K字符串的字典(最多可以包含50个以上的字符),我正在尝试查找给定字符串是否在具有“编辑”距离公差的字典中。(例如Levenshtein)。在进行搜索之前,我可以预先计算任何类型的数据结构。我的目标是尽快针对该字典运行数千个字符串并返回最近的邻居。如果有一个明显更快的算法,我会得到一个bool值来说明给定的是否在字典中为此,我首先尝试计算所有Levenshtein距离并取最小值,这显然非常慢。所以我尝试根据这篇文章实现一个LevenshteinTriehttp://stevehanov.ca/blog/index.php?id=114在这里查看我的重现基准的要