背景:我正在清理以制表符分隔的大型(无法保存在内存中)文件。当我清理输入文件时,我在内存中建立了一个列表;当它达到1,000,000个条目(大约1GB内存)时,我对其进行排序(使用下面的默认键)并将列表写入文件。此类用于将排序的文件放回一起。它适用于我迄今为止遇到的文件。到目前为止,我最大的案例是合并66个排序文件。问题:我的逻辑是否存在漏洞(哪里脆弱)?我实现了归并排序吗算法正确吗?是否有任何明显的改进可以做吗?示例数据:这是对其中一个文件中一行的抽象:'hash_of_SomeStringId\tSomeStringId\t\t\twww.somelink.com\t\tOther