我有一段代码是在x86处理器上运行的C++应用程序的瓶颈,我们从两个数组中获取double值,转换为float并存储在结构数组中。这是一个瓶颈的原因是它被调用时有非常大的循环,或者被调用了数千次。是否有使用SIMDIntrinsics执行此复制和强制转换操作的更快方法?我看过thisansweronfastermemcpy但没有解决类型转换问题。简单的C++循环情况如下所示int_iNum;constunsignedint_uiDefaultOffset;//aconstantdouble*pInputValues1;//arrayofdoublevalues,count=_iNum;