在多次尝试优化代码之后,似乎最后一个资源是尝试使用多个内核运行下面的代码。我不确切知道如何转换/重新构造我的代码,以便它可以使用多个内核运行得更快。如果我能得到指导以实现最终目标,我将不胜感激。最终目标是能够尽可能快地为数组A和B运行此代码,其中每个数组包含大约700,000个元素。这是使用小数组的代码。700k元素数组被注释掉了。importnumpyasnpdefismember(a,b):foriina:index=np.where(b==i)[0]ifindex.size==0:yield0else:yieldindexdeff(A,gen_obj):my_array=np.a