我想加快我的代码的一部分,但我认为没有一种更好的方法可以进行以下计算:floatinvSum=1.0f/float(sum);for(inti=0;ifor循环中的numBins通常为10,但是经常会调用此位(频率为每秒80帧,每帧至少被调用8次)我尝试使用一些SSE方法,但这只是稍微加快了这段代码的速度。我想我可以避免两次计算midPoint,但是我不确定如何计算。有没有更好的方法来计算fmean和var?这是SSE代码://makehistcontainamultipleof4validvaluesfor(inti=numBins;i我可能做错了,因为我没有得到很多期望的改进。SS