由于我的np.dot由OpenBlas和Openmpi加速,我想知道是否有可能写出双和foriinrange(N):forjinrange(N):B[k,l]+=A[i,j,k,l]*X[i,j]作为内积。就在我正在使用的那一刻B=np.einsum("ijkl,ij->kl",A,X)但不幸的是它很慢并且只使用一个处理器。有什么想法吗?编辑:我用一个简单的例子对到目前为止给出的答案进行了基准测试,看起来它们都处于相同的数量级:A=np.random.random([200,200,100,100])X=np.random.random([200,200])defB1():return