jjzjj

ios - 多次调用 glDrawElements 是否比在 GLSL 中对每个片段进行相同的计算更有效?

coder 2024-01-21 原文

我正在试验 GLSL(在 iOS 中),我编写了一个简单的着色器,它为两个圆(centerradius边缘平滑)。它是在整个屏幕上使用单个四边形绘制的,着色器使用 gl_FragCoord 并确定每个点是在圆圈内还是圆圈外 - 它计算圆圈内的 alpha 为 1.0,平滑地向下着色到 0.0在 radius + edgeSmoothing 之外,然后它对 alpha 应用镜像式钳位(三角波以获得奇偶填充规则效果)并设置 gl_FragColor = mix(vec4(0.0),颜色, alpha);.

这很好用,但我想要 5 种不同颜色的 10 个圆圈,所以我为所有着色器制服调用 glUniform 并调用 glDrawElements 分别绘制四边形五次(使用不同的颜色和圆圈参数),我的混合模式是加法的,所以不同的颜色加起来很好地给出了我想要的图案,完美!

请记住,这是一个实验,所以我尝试更多地了解 GL 和 GLSL,而不是画圆圈。

现在我认为只绘制一次四边形并将所有 10 个圆的参数传递到统一数组(centers[10], radii[10])会更有效率 等),在 GLSL 中循环遍历它们,并将它们在着色器中产生的颜色相加。所以我编写了这个着色器并重构了我的代码以一次传递所有圆参数。我得到了正确的结果(输出看起来完全一样)但是我的帧速率从 15fps 下降到大约 3fps - 它慢了五倍!!

着色器代码现在有循环,但使用相同的数学计算每对圆的 alpha 值。为什么这么慢?我做的工作肯定比填充整个屏幕五次和 GL 进行五次加法混合(即读取像素值、混合和写回)少吗?现在我只是计算累积的颜色并只填满整个屏幕一次?

谁能解释为什么我认为的优化会产生相反的效果?

更新:将此代码粘贴到 ShaderToy 中以了解我在说什么。

#ifdef GL_ES
precision highp float;
#endif

uniform float time;

void main(void)
{
    float r, d2, a0, a1, a2;
    vec2 pos, mid, offset;
    vec4 bg, fg;

    bg = vec4(.20, .20, .40, 1.0);
    fg = vec4(.90, .50, .10, 1.0);
    mid = vec2(256.0, 192.0);

    // Circle 0
    pos = gl_FragCoord.xy - mid;
    d2 = dot(pos, pos);
    r = 160.0;
    a0 = smoothstep(r * r, (r + 1.0) * (r + 1.0), d2);

    // Circle 1
    offset = vec2(110.0 * sin(iGlobalTime*0.8), 110.0 * cos(iGlobalTime));
    pos = gl_FragCoord.xy - mid + offset;
    d2 = dot(pos, pos);
    r = 80.0;
    a1 = smoothstep(r * r, (r + 1.0) * (r + 1.0), d2);

    // Circle 2
    offset = vec2(100.0 * sin(iGlobalTime*1.1), -100.0 * cos(iGlobalTime*0.7));
    pos = gl_FragCoord.xy - mid + offset;
    d2 = dot(pos, pos);
    r = 80.0;
    a2 = smoothstep(r * r, (r + 1.0) * (r + 1.0), d2);

    // Calculate the final alpha
    float a = a0 + a1 + a2;
    a = abs(mod(a, 2.0) - 1.0);

    gl_FragColor = mix(bg, fg, a);
}

最佳答案

增加片段着色器中操作的复杂性会对渲染时间产生非线性影响。在某些情况下,即使添加一个看起来简单的分支操作也会使着色器慢 10 倍。

在 iOS 设备上的片段着色器中,循环尤其可怕,所以我会不惜一切代价避免它们。我敢打赌,如果您将该循环展开为针对统一值的一系列检查,它的性能会更好。

然而,对你的制服运行 10 次检查,这听起来像是涉及步骤或平滑步骤,当应用于帧缓冲区中的每个像素时,将非常昂贵。这也相当浪费,因为屏幕的很大一部分不会被任何特定的圆圈覆盖。

无需使用单独的 glDrawElements() 调用来绘制单个圆圈,也无需通过绘制屏幕大小的四边形来绘制单个圆圈。我在 this answer 中描述了我用来在我的开源应用程序中绘制球体冒名顶替者的过程。我可以在最新的 iOS 设备上以 60 FPS 的速度在屏幕上绘制数千个圆圈(球体)。为此,我为每个刚好足够大的圆传递一个四边形包含那个圆而不是更大。这些四边形都聚集在一个数组中并一次绘制。每个圆的附加参数作为属性与顶点数据一起传递。例如,我不需要指定半径,因为我在顶点旁边使用从 (-1, -1) 到 (1, 1) 的冒充空间坐标,并进行简单的计算以确定一个点是否在圆内。

如果您只绘制每个圆圈所需的片段,而不绘制更多片段,您将减轻管道片段处理部分的大量负载。您仍然需要启用混合模式,但四边形大小的减少,加上片段着色器中执行的操作的简化,将带来更好的整体性能。

关于ios - 多次调用 glDrawElements 是否比在 GLSL 中对每个片段进行相同的计算更有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13131279/

有关ios - 多次调用 glDrawElements 是否比在 GLSL 中对每个片段进行相同的计算更有效?的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby - 多次弹出/移动 ruby​​ 数组 - 2

    我的代码目前看起来像这样numbers=[1,2,3,4,5]defpop_threepop=[]3.times{pop有没有办法在一行中完成pop_three方法中的内容?我基本上想做类似numbers.slice(0,3)的事情,但要删除切片中的数组项。嗯...嗯,我想我刚刚意识到我可以试试slice! 最佳答案 是numbers.pop(3)或者numbers.shift(3)如果你想要另一边。 关于ruby-多次弹出/移动ruby​​数组,我们在StackOverflow上找到一

  3. ruby - 检查数组是否在增加 - 2

    这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife

  4. ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2

    我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案

  5. ruby-on-rails - Ruby 检查日期时间是否为 iso8601 并保存 - 2

    我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby​​是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查

  6. 使用 ACL 调用 upload_file 时出现 Ruby S3 "Access Denied"错误 - 2

    我正在尝试编写一个将文件上传到AWS并公开该文件的Ruby脚本。我做了以下事情:s3=Aws::S3::Resource.new(credentials:Aws::Credentials.new(KEY,SECRET),region:'us-west-2')obj=s3.bucket('stg-db').object('key')obj.upload_file(filename)这似乎工作正常,除了该文件不是公开可用的,而且我无法获得它的公共(public)URL。但是当我登录到S3时,我可以正常查看我的文件。为了使其公开可用,我将最后一行更改为obj.upload_file(file

  7. ruby - 检查日期是否在过去 7 天内 - 2

    我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/

  8. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  9. ruby - 是否可以覆盖 gemfile 进行本地开发? - 2

    我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI

  10. c# - 如何在 ruby​​ 中调用 C# dll? - 2

    如何在ruby​​中调用C#dll? 最佳答案 我能想到几种可能性:为您的DLL编写(或找人编写)一个COM包装器,如果它还没有,则使用Ruby的WIN32OLE库来调用它;看看RubyCLR,其中一位作者是JohnLam,他继续在Microsoft从事IronRuby方面的工作。(估计不会再维护了,可能不支持.Net2.0以上的版本);正如其他地方已经提到的,看看使用IronRuby,如果这是您的技术选择。有一个主题是here.请注意,最后一篇文章实际上来自JohnLam(看起来像是2009年3月),他似乎很自在地断言RubyCL

随机推荐