我想知道如果删除空格,您将如何对英语(或其他西方语言)的字符串进行分词?问题的灵感来自于村上小说中的羊人角色'DanceDanceDance'在小说中,羊人被翻译成这样的话:"likewesaid,we'lldowhatwecan.Trytoreconnectyou,towhatyouwant,"saidtheSheepMan."Butwecan'tdoit-alone.Yougottaworktoo."因此,保留了一些标点符号,但不是全部。足以供人类阅读,但有些武断。您为此构建解析器的策略是什么?字母的常见组合、音节数、条件语法、前视/后视正则表达式等?具体来说,在Python方面,