jjzjj

ios - Swift:在沉默 x 秒后停止语音识别

我一直在寻找解决方案,但我看到的所有解决方案都令人困惑,所以我想我会提出一个新问题。我正在使用语音库,我希望识别任务在2秒后没有用户输入时停止。我知道我想使用计时器,但我无法弄清楚将它放在哪里以及如何更新它。我在按下录制按钮时启动计时器,并在按下停止录制按钮时使它无效。但是我在哪里检查用户是否添加了新的输入?我正在考虑保存最后一个转录并将其与下一个进行比较:当它们不同时,重置计时器。这是我的代码:recognitionTask=speechRecognizer.recognitionTask(with:recognitionRequest){result,errorinvarisFin

java - 识别使用 Java 的人所说的字母

我需要识别用户对着设备的麦克风说出的字母表。该设备可以是安卓驱动的移动电话。例如,当用户说“R”时,它应该给我“R”而不是“Are”..如何在Java中完成这种口头字母识别?我正在寻找可以用代码轻松表达的想法。编辑根据@DavidHilditch的一项建议,我想出了下面这张人物图及其读音词。A-ye,a,yayB-be,bee,C-see,sea,D-thee,dee,deE-eh,ee,F-eff,FG-jee,H-edge,hedge,hatch,itchI-Aye,eye,IJ-je,jay,joyK-kay,ke,L-el,yell,hellM-am,yam,emN-yen,e

java - 语音转文本 api/库

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion我需要的是一个API/库,它允许我将.wav文件(或其他必要的媒体文件)转换为它们的等效文本。是否存在这样的库/api?

语音质量评估 Speech quality assessment 方法与代码编写

目前常用语音相对评估指标(参考)4个,绝对评估(无参考)指标3个。简述如下所示:**相对指标:1、pesq:共综合以下5个方面打分,分别为音频清晰度、音量、背景噪音音频中的可变延迟或滞后、丢失、音频干扰,PESQ评分是从-0.5到4.5的分数,分数越高表示质量越好。可根据以下分数区间进行参考:-0.5–1.99:语音质量极差,完全听不清楚语音的具体内容;2.00–2.39:语音质量很差,需要集中很多精神或注意力才能听清楚具体内容;2.40–2.79:语音质量较差,需要集中较多的精神或注意力才能听到具体内容;2.80–3.29:语音质量一般,仅需要稍微集中一下注意力就能听很清楚;3.30–3.7

论文翻译:2021_A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Based on Recurrent Neural Network

论文地址:一种新的基于循环神经网络的远场语音通信实时噪声抑制算法引用格式:ChenB,ZhouY,MaY,etal.ANewReal-TimeNoiseSuppressionAlgorithmforFar-FieldSpeechCommunicationBasedonRecurrentNeuralNetwork[C]//2021IEEEInternationalConferenceonSignalProcessing,CommunicationsandComputing(ICSPCC).IEEE,2021:01-05.摘要  在远程会议场景中,语音通常会受到背景噪声的影响,从而降低语音的清晰度

html - 有没有办法将语法与 HTML 5 语音输入 API 一起使用?

我正在使用HTML5语音输入API,我想让服务器知道它可以从语音输入中返回哪些答案。有没有办法设置可能的输入列表? 最佳答案 在谷歌浏览器中你还不能使用语法,总的来说他们决定只使用自由形式的识别。相关问题是GrammarinGooglespeechAPI.FirefoxWebSpeechAPI支持语法,但该功能是实验性的。如果您的浏览器支持HTML5音频,您可能想尝试使用Pocketsphinx.js从语法中识别单词库,它提供了基于javascript的识别器,这对语法应该非常有用。 关

html - 有没有办法将语法与 HTML 5 语音输入 API 一起使用?

我正在使用HTML5语音输入API,我想让服务器知道它可以从语音输入中返回哪些答案。有没有办法设置可能的输入列表? 最佳答案 在谷歌浏览器中你还不能使用语法,总的来说他们决定只使用自由形式的识别。相关问题是GrammarinGooglespeechAPI.FirefoxWebSpeechAPI支持语法,但该功能是实验性的。如果您的浏览器支持HTML5音频,您可能想尝试使用Pocketsphinx.js从语法中识别单词库,它提供了基于javascript的识别器,这对语法应该非常有用。 关

php - 使用 Google Translate 在 PHP 中进行文字转语音

我正在尝试将单词转换为语音..到目前为止,我已经试过了:在我的html文件中:"type="audio/mp3"/>我在输出中创建了hello和音频播放器。但是没有播放文件,也没有在文件夹中创建文件? 最佳答案 您尝试访问的URL有问题。它被打破!你应该先尝试一下。我在FF控制台上找到的新URL是:http://translate.google.com/translate_tts?ie=UTF-8&q=Hello&tl=en&total=1&idx=0&textlen=5&prev=input对于单个词Hello。你看到你必须在te

php - 使用 Google Translate 在 PHP 中进行文字转语音

我正在尝试将单词转换为语音..到目前为止,我已经试过了:在我的html文件中:"type="audio/mp3"/>我在输出中创建了hello和音频播放器。但是没有播放文件,也没有在文件夹中创建文件? 最佳答案 您尝试访问的URL有问题。它被打破!你应该先尝试一下。我在FF控制台上找到的新URL是:http://translate.google.com/translate_tts?ie=UTF-8&q=Hello&tl=en&total=1&idx=0&textlen=5&prev=input对于单个词Hello。你看到你必须在te

ios - 如何在 iOS 9 上获取所有声音的列表?

获取“所有”AVSpeechSynthesisVoice对象列表的标准方法是请求它:[AVSpeechSynthesisVoicespeechVoices]但是,这只会显示每个语言区域对的唯一默认语音。例如对于en-US:"Language:en-US,Name:Samantha,Quality:Default",如果我在“设置”应用中查看一般→辅助功能→语音→语音→英语我看到我选择了“SiriFemale(Enhanced)”,但无法从代码中选择该声音。完整列表是所以最大的问题是:我该如何选择,例如Alex或SiriFemale作为来自代码的声音? 最佳答