如果这是一个重复的问题,请提前原谅-我搜索了stackoverflow,但没有发现这个问题。自从我开始使用800万行数据集以来,我正在运行Python2.7;我收到了一条错误消息,我的计算机在内存上很低。上传数据集_我什至没有开始处理它时,我会收到此消息。它实际上使我的整个计算机撞了好几次。由于这是我的工作计算机,所以我要求它清洁我的虚拟内存,增加任何记忆力,甚至清洁我的高清。但是正如预期的那样,我仍在解决这个问题。在个人环境中,我在AWS上使用PythonJupyter笔记本来克服此问题-但我没有此选项。你会推荐什么?Pyspark是最好的选择吗?我是新来的火花,是否有类似于Spark的Ju