在做NVIDIA制作的CUDA的一些基本示例时,我复制了一些代码来测试从CPU到GPU计算的矩阵乘法加速。查看结果30分钟后,看到我的CPU(是CPU)的计算速度比我的GPU快1000倍,我意识到时序工作不正常。一段代码看起来像(这是来自NVIDIA的代码)://CreatetimerscudaEvent_tstart;cudaEvent_tstop;floatsimpleKernelTime;floatoptimisedKernelTime;//starttimercudaEventCreate(&start);cudaEventCreate(&stop);cudaEventReco