jjzjj

c++ - 如何在Windows异常处理程序中设置MMX寄存器以模拟不受支持的3DNow!指示

coder 2023-11-10 原文

我正在尝试复兴使用3DNow的旧Win32游戏!指令集以进行3D渲染。

在Win7-Win10等现代OS上,不允许FPADD或FPMUL之类的Win10指令,并且该程序将引发异常。

自3DNow数量!游戏使用的指令非常有限,在我的VS2008 MFC程序中,我尝试使用矢量化异常处理来获取MMX寄存器的值,模拟3DNow! C代码的指令,然后将值推回处理器3DNow!寄存器。

到目前为止,我已经成功完成了前两个步骤(我从偏移量32处的ExceptionInfo->ExtendedRegisters字节数组中获取mmx寄存器值,并使用浮点类型C指令进行计算),但是我的问题是,无论我如何尝试更新MMX寄存器值,寄存器值似乎保持不变。

假设我的_asm语句可能是错误的,我还使用以下简单语句进行了一些最小的测试:

_asm movq mm0 mm7

该语句的执行没有其他异常(exception),但是在检索MMX寄存器值时,我仍然发现原始值未更改。

如何使作业有效?

最佳答案

On modern OSs like Win7 - Win10 instructions like FPADD or FPMUL are not allowed



您的CPU很可能不支持3DNow! AMD dropped it for Bulldozer-family,英特尔从未支持过。因此,除非您在Athlon64/Phenom(或Via C3)上运行现代Windows,否则您的CPU不支持它。

(有趣的是: PREFETCHW 最初是3DNow!指令,并且仍受支持(具有其自己的CPUID功能位)。很长时间以来,英特尔CPU一直将其作为NOP运行,但Broadwell和更高版本(IIRC)确实预取了缓存行进入拥有所有权读取状态的排他状态。)

除非该游戏只能在AMD硬件上运行,否则它必须具有避免3DNow的代码路径。修复其CPU检测以停止检测到您的CPU具有3DNow。 (也许您拥有最近的AMD,并且假定任何AMD都具有3DNow?)

(对此进行更新:OP's comments say that the other code paths don't work for some reason。这是一个问题。)

从异常处理程序返回的数据可能会从保存的状态中恢复寄存器,因此更改异常处理程序中的寄存器值对主程序没有影响也就不足为奇了。

显然updating ExtendedRegisters in memory doesn't do the trick,所以那只是保存状态的一个拷贝。

从异常处理程序修改MMX寄存器的答案可能与整数或XMM寄存器的答案相同,因此请查阅MS的文档。

替代建议:

重写3DNow代码以使用SSE2。 (您说的只是其中的一小部分?)。 SSE2是x86-64的基线,通常可以安全地假定为32位x86。

没有源代码,您仍然可以为使用3DNow的一些功能修改asm。您实际上可以更改指令以使用64位加载/存储到XMM寄存器中,而不是3DNow! 64位加载/存储,并将PFMUL替换为mulps等。(如果寄存器用完并且3DNow代码使用了内存源操作数,这可能会变得有些冗长。addps xmm0, [mem]需要16B对齐的内存,并进行16字节加载因此,您可能必须添加溢出/重载以借用另一个寄存器作为临时对象)。

如果您没有空间就地重写函数,请将jmp放在您有空间添加新代码的地方。

大多数the 3DNow instructions在SSE中具有等效功能,但是您可能需要一些额外的movaps指令来复制寄存器以实现PFCMPGE。如果您可以忽略NaN的可能性,则可以将 cmpps 与不少于谓词一起使用。 (在没有AVX的情况下,SSE仅具有基于小于或不小于的比较谓词)。
PFSUBR易于使用备用寄存器进行仿真,只需复制和subps即可反转。 (或SUBPS,然后用XORPS反转符号)。 PFRCPIT1(优化的倒数第一个迭代)等等没有单指令实现,但是如果您不想使用implement Newton-Raphson iterations with mulps and addps(或使用AVX sqrtps),则可以只使用divpsvfmadd。现代CPU比该游戏的设计速度要快得多。

您可以使用movsd(SSE2 double 加载/存储指令)将一对单精度浮点数从存储器/存储到XMM寄存器的低64位/存储到XMM寄存器的低64位。您还可以使用movlps存储一对,但是仍然使用movsd进行加载,因为它会将上半部分置零而不是合并,因此它不依赖于寄存器的旧值。

使用 movdq2q mm0, xmm0 movq2dq xmm0, mm0在XMM和MMX之间移动数据。

使用movaps xmm1, xmm0复制寄存器,即使您的数据仅处于低位。 (movsd xmm1, xmm0将低半部分合并为原始的高半部分。movq xmm1, xmm0将高半部分归零。)
addpsmulps在上半部分使用零可以正常工作。 (如果有任何垃圾(上半部分)产生异常结果,它们可能会减慢速度,因此最好将上半部分保持为零)。请参阅http://felixcloutier.com/x86/以获取指令集引用(以及x86标签Wiki中的其他链接)。

FP数据的任何改组都可以使用shufpspshufd在XMM寄存器中完成,而无需复制回MMX寄存器以使用任何MMX改组。

关于c++ - 如何在Windows异常处理程序中设置MMX寄存器以模拟不受支持的3DNow!指示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46969423/

有关c++ - 如何在Windows异常处理程序中设置MMX寄存器以模拟不受支持的3DNow!指示的更多相关文章

  1. ruby - 如何在 Ruby 中顺序创建 PI - 2

    出于纯粹的兴趣,我很好奇如何按顺序创建PI,而不是在过程结果之后生成数字,而是让数字在过程本身生成时显示。如果是这种情况,那么数字可以自行产生,我可以对以前看到的数字实现垃圾收集,从而创建一个无限系列。结果只是在Pi系列之后每秒生成一个数字。这是我通过互联网筛选的结果:这是流行的计算机友好算法,类机器算法:defarccot(x,unity)xpow=unity/xn=1sign=1sum=0loopdoterm=xpow/nbreakifterm==0sum+=sign*(xpow/n)xpow/=x*xn+=2sign=-signendsumenddefcalc_pi(digits

  2. ruby - 在 Ruby 程序执行时阻止 Windows 7 PC 进入休眠状态 - 2

    我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0

  3. ruby - 如何在 buildr 项目中使用 Ruby 代码? - 2

    如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby​​

  4. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

    我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

  5. ruby-on-rails - 如何在 ruby​​ 中使用两个参数异步运行 exe? - 2

    exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby​​中使用两个参数异步运行exe吗?我已经尝试过ruby​​命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe,无需等待进程完成是否有任何ruby​​gems会支持我的问题? 最佳答案 您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除

  6. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  7. ruby - 如何在续集中重新加载表模式? - 2

    鉴于我有以下迁移:Sequel.migrationdoupdoalter_table:usersdoadd_column:is_admin,:default=>falseend#SequelrunsaDESCRIBEtablestatement,whenthemodelisloaded.#Atthispoint,itdoesnotknowthatusershaveais_adminflag.#Soitfails.@user=User.find(:email=>"admin@fancy-startup.example")@user.is_admin=true@user.save!ende

  8. ruby - 如何在 Ruby 中拆分参数字符串 Bash 样式? - 2

    我正在为一个项目制作一个简单的shell,我希望像在Bash中一样解析参数字符串。foobar"helloworld"fooz应该变成:["foo","bar","helloworld","fooz"]等等。到目前为止,我一直在使用CSV::parse_line,将列分隔符设置为""和.compact输出。问题是我现在必须选择是要支持单引号还是双引号。CSV不支持超过一个分隔符。Python有一个名为shlex的模块:>>>shlex.split("Test'helloworld'foo")['Test','helloworld','foo']>>>shlex.split('Test"

  9. ruby - 如何在 Lion 上安装 Xcode 4.6,需要用 RVM 升级 ruby - 2

    我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby,并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121

  10. ruby-on-rails - 如何在 ruby​​ 交互式 shell 中有多行? - 2

    这可能是个愚蠢的问题。但是,我是一个新手......你怎么能在交互式ruby​​shell中有多行代码?好像你只能有一条长线。按回车键运行代码。无论如何我可以在不运行代码的情况下跳到下一行吗?再次抱歉,如果这是一个愚蠢的问题。谢谢。 最佳答案 这是一个例子:2.1.2:053>a=1=>12.1.2:054>b=2=>22.1.2:055>a+b=>32.1.2:056>ifa>b#Thecode‘if..."startsthedefinitionoftheconditionalstatement.2.1.2:057?>puts"f

随机推荐