jjzjj

outputWords

全部标签

c# - 检测相似电子邮件地址的最佳方法?

我有一个包含大约20,000个电子邮件地址的列表,我知道其中一些是试图绕过“每封电子邮件1个”限制的欺诈性尝试,例如username1@gmail.com、username1a@gmail.com、username1b@gmail.com等。我想找到类似的电子邮件地址进行评估。目前,我正在使用Levenshtein算法来对照列表中的其他电子邮件检查每封电子邮件,并报告任何编辑距离小于2的电子邮件。但是,这非常慢。有没有更有效的方法?我现在使用的测试代码是:usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;using