jjzjj

LongHashBag

全部标签

java - 使用 hashmap 改进词频计数

对于我的一个应用程序,必须经常调用以下函数。此功能占用大量CPU,因此我想知道您是否知道如何提高性能。该代码计算四个字符组合的出现次数。测试时发现map中的条目数在100左右。文本长度在100到800之间。200的初始大小是猜测,代码似乎比不指定初始值运行得更快尺寸。不过,这可能不是最佳值。privateMapgetTetagramCount(finalStringtext){finalMapcipherTetagrams=newHashMap(200);for(inti=0;i 最佳答案 我在NLP和机器学习方面做了很多工作,所以