我正在Windows和Linux(x86-64)上运行一个程序。它使用相同的编译器(IntelParallelStudioXE2017)和相同的选项编译,Windows版本比Linux版本快3倍。罪魁祸首是调用std::erf这两种情况都在英特尔数学库中得到解决(默认情况下,它在Windows上是动态链接,在Linux上是静态链接,但在Linux上使用动态链接可以获得相同的性能)。这是一个重现问题的简单程序。#include#includeintmain(){intn=100000000;floatsum=1.0f;for(intk=0;k当我使用vTune分析这个程序时,我发现程序集