示例:说话->Spubeak,moreinfohere不要给我一个解决方案,而是给我指出正确的方向或告诉我可以使用哪个python库?我正在考虑正则表达式,因为我必须找到一个元音字母,但是我可以使用哪种方法在元音字母前插入“ub”? 最佳答案 它比一个简单的正则表达式更复杂e.g.,"Hi,howareyou?"→"Hubi,hubowubareyubou?"简单的正则表达式不会捕捉到e在are中不发音。你需要一个提供发音词典的库,比如nltk.corpus.cmudict:fromnltk.corpusimportcmudict#
我有一个包含一些字符的字符串,我正在寻找这些字符的组织方式,使其最容易发音。例如,如果我有字母“ascrlyo”,那么有些排列会比其他排列更容易发音。以下可能获得“高分”:scarolycrasoly以下可能会得到低分的地方:oascrlyyrlcsoa有没有我可以使用的简单算法?或者更好的是,实现此目的的Python功能?谢谢! 最佳答案 首先解决一个更简单的问题:给定的单词是否可发音?机器学习“监督学习”在这里可能很有效。在字典单词和乱序词的训练集上训练二元分类器(假设乱序词都是不可发音的)。对于特征,我建议计算二元组和三元组。
我正在尝试为iOS应用程序实现无障碍功能,但遇到了其中的一些细微差别和怪癖。例如:我的应用程序中有一个标签,上面写着:“这是一个现场事件。”在此上下文中,live的定义是“当前正在发生的事情”,发音时应与“五”押韵。但是,画外音将“live”这个词理解为:“liveandletdie”,并且在与“Give”押韵时读错了。同样,我遇到的另一个问题是“ADDASELECTION”上下文中的“ADD”一词。这个词在其上下文中的意思是“向篮子里添加东西”,但读作“A.D.D.(注意力缺陷障碍)”在为您的应用启用无障碍功能时,是否有编程方式为单词提供上下文? 最佳答案
关闭。这个问题是opinion-based.它目前不接受答案。关闭2年前。锁定。这个问题及其答案是locked因为这个问题离题但具有历史意义。它目前不接受新的答案或互动。我很少见到其他程序员!当我第一次看到该标记时,我的想法是“暗示”,因为它会像在数学证明中那样解读它,但这显然不是它的意义。那么我该如何说或读“=>”,如:-IEnumerableAdults=people.Where(p=>p.Age>16)或者是否有一致的说法?
Closed.ThisquestiondoesnotmeetStackOverflowguidelines。它当前不接受答案。想改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。7年前关闭。Improvethisquestion听起来可能有点奇怪,但对于某些演示文稿问题,这对我来说很重要。所以应该是:“m|y|s|q|l”吗?(拼写)“我的肮脏”?“我寻求好”?还是完全不同的东西? 最佳答案 MySQL的正式发音为/maɪˌɛskjuːˈɛl/(“MyS-Q-L”)。来自:底部的https://dev.mysql.
总的来说,我对Android的默认文本转语音引擎(即com.svox.pico)印象深刻。正如预期的那样,它会误读一些单词(就像我一样),因此偶尔需要一些发音指导。因此,我想知道以拼音方式拼写picoTTS引擎错误发音的单词的最佳做法。例如,Chachalaca鸟的正确发音是CHAH-chah-LAH-kah。以下是TTS引擎生成的内容:mTts.speak("Chachalaca",TextToSpeech.QUEUE_ADD,null);//output:chuh-KAL-uh-KUHmTts.speak("CHAH-chah-LAH-kah",TextToSpeech.QUEUE
我正在尝试从列表中获取所有发音相似的单词。我尝试使用余弦相似度来获取它们,但这不能满足我的目的。fromsklearn.metrics.pairwiseimportcosine_similaritydataList=['two','fourth','forth','dessert','to','desert']cosine_similarity(dataList)我知道这不是正确的方法,我似乎无法得到如下结果:result=['xx','xx','yy','yy','zz','zz']它们的意思是听起来相似的词 最佳答案 首先,您需
Closed.Thisquestionisoff-topic。它当前不接受答案。想改善这个问题吗?Updatethequestion,所以它是用于堆栈溢出的on-topic。7年前关闭。Improvethisquestion我不确定此类问题的正确答案,如果不能,请告诉我,我将删除此问题。无论如何,Tkinter的正确发音是什么?我环顾四周,有人说TeaKayInter,Tink-ter,TeaKinter..等等。但是哪一个被正式接受? 最佳答案 不是Tink-ter,那不是同一个名字。docs中的第一件事是:Tkinter模块(“
我知道SOUNDEX和(双)Metaphone,但这些方法无法让我测试单词整体的相似性-例如“Hi”听起来与“Bye”非常相似,但这两种方法会将它们标记为完全不同。Ruby中是否有任何库或您知道的任何方法能够确定两个词之间的相似性?(bool值相似/不相似,或者数值相似度为40%)编辑:如果有一种简单的方法可以“插入”不同的方言或语言,则可额外加分! 最佳答案 我认为您描述的是编辑距离。是的,有一些gem。如果您喜欢纯Ruby,请选择文本gem。$geminstalltextThedocs有更多的细节,但这是它的症结所在:Text:
Kaldi搭建语音识别系统实践——发音词典相关文件准备在上一篇文章,我们讲述了如何利用kaldi进行声学特征的提取,以及当前比较流行的声学特征(MFCC)。语音识别系统除了声学特征外,还有需要音素、发音词典、声学单元及kaldi识别的格式*.fst等文件发音词典开源普通话数据集aishell为我们提供了发音词典,如下所示该发音词典主要采用声韵母结构,其中a1中数字代表声调,常用的声调有5种,分别阴平、阳平、上声、及去声,外加一个轻声;而对于静音或者噪音,则统一采用SIL(silent的3个首字母)来表示。声学单元kaldi中关于声学单元有四种文件,在data/local/dict目录下,由脚本