speech_JJZJJ

ios - 如何在 iOS 9 上获取所有声音的列表？

获取“所有”AVSpeechSynthesisVoice对象列表的标准方法是请求它:[AVSpeechSynthesisVoicespeechVoices]但是，这只会显示每个语言区域对的唯一默认语音。例如对于en-US:"Language:en-US,Name:Samantha,Quality:Default",如果我在“设置”应用中查看一般→辅助功能→语音→语音→英语我看到我选择了“SiriFemale(Enhanced)”，但无法从代码中选择该声音。完整列表是所以最大的问题是:我该如何选择，例如Alex或SiriFemale作为来自代码的声音？最佳答

何在 ios AVSpeechSynthesisVoice ttsbundle Language cocoa text-to-speech speech

ios - 如何通过 Objective-C 中的 Speech 框架实现语音转文本？

我想使用iOS语音框架在我的Objective-C应用程序中进行语音识别。我找到了一些Swift示例，但在Objective-C中找不到任何内容。是否可以从Objective-C访问此框架？如果是，怎么办？最佳答案在花了足够多的时间寻找Objective-C示例之后——甚至在Apple文档中——我找不到任何像样的东西，所以我自己想出了办法。头文件(.h)/*!*ImporttheSpeechframework,assigntheDelegateanddeclarevariables*/#import@interfaceViewC

Objective-C Objective code the recognitionRequest ios speech-recognition speech-to-text mobile-application

ios - 如何通过 Objective-C 中的 Speech 框架实现语音转文本？

我想使用iOS语音框架在我的Objective-C应用程序中进行语音识别。我找到了一些Swift示例，但在Objective-C中找不到任何内容。是否可以从Objective-C访问此框架？如果是，怎么办？最佳答案在花了足够多的时间寻找Objective-C示例之后——甚至在Apple文档中——我找不到任何像样的东西，所以我自己想出了办法。头文件(.h)/*!*ImporttheSpeechframework,assigntheDelegateanddeclarevariables*/#import@interfaceViewC

Objective-C Objective code the recognitionRequest ios speech-recognition speech-to-text mobile-application

Microsoft Speech Platform 运行库和语音包

MicrosoftSpeechPlatform运行库和语音包运行库下载huihui语音包运行库下载32位:https://download.microsoft.com/download/A/6/4/A64012D6-D56F-4E58-85E3-531E56ABC0E6/x86_SpeechPlatformRuntime/SpeechPlatformRuntime.msi64位:https://download.microsoft.com/download/A/6/4/A64012D6-D56F-4E58-85E3-531E56ABC0E6/x64_SpeechPlatformRuntime/

Microsoft 语音 download SpeechPlatformRuntime huihui 语音识别

ios - 使用 Speech kit ios 时由于未捕获的应用程序崩溃而终止应用程序

我在实现语音转文本时遇到了这个错误:Terminatingappduetouncaughtexception'com.apple.coreaudio.avfaudio',reason:'requiredconditionisfalse:_recordingTap==nil'和:ERROR:[0x1b2df5c40]>avae>AVAudioNode.mm:565:CreateRecordingTap:requiredconditionisfalse:_recordingTap==nil这是我的viewController的代码:publicclassViewController:UIV

ios Speech recordButton recognitionRequest self swift sfspeechrecognizer

ios - 使用 Speech kit ios 时由于未捕获的应用程序崩溃而终止应用程序

我在实现语音转文本时遇到了这个错误:Terminatingappduetouncaughtexception'com.apple.coreaudio.avfaudio',reason:'requiredconditionisfalse:_recordingTap==nil'和:ERROR:[0x1b2df5c40]>avae>AVAudioNode.mm:565:CreateRecordingTap:requiredconditionisfalse:_recordingTap==nil这是我的viewController的代码:publicclassViewController:UIV

ios Speech recordButton recognitionRequest self swift sfspeechrecognizer

c# - 在 Kinect 中使用 System.Speech

我正在为一个大学项目开发语音到文本字幕应用程序的原型(prototype)。我稍后将在我的项目中使用手势识别，所以我认为使用Kinect作为麦克风源而不是使用额外的麦克风是个好主意。我的应用程序的想法是识别自发的语音，例如长而复杂的句子(我知道语音听写不会很完美，但不会)。我见过许多Kinect语音示例，其中引用了Microsoft.Speech，但没有引用System.Speech。由于我需要训练语音引擎并将DictationGrammar加载到语音识别引擎中，Microsoft.Speech是我唯一的选择。在使用Kinect作为直接麦克风音频源时，我设法让它工作，但由于我加载K

c#Kinect speechRecognitionEngine audioSource .net audio system.speech.recognition

c# - 在 Kinect 中使用 System.Speech

我正在为一个大学项目开发语音到文本字幕应用程序的原型(prototype)。我稍后将在我的项目中使用手势识别，所以我认为使用Kinect作为麦克风源而不是使用额外的麦克风是个好主意。我的应用程序的想法是识别自发的语音，例如长而复杂的句子(我知道语音听写不会很完美，但不会)。我见过许多Kinect语音示例，其中引用了Microsoft.Speech，但没有引用System.Speech。由于我需要训练语音引擎并将DictationGrammar加载到语音识别引擎中，Microsoft.Speech是我唯一的选择。在使用Kinect作为直接麦克风音频源时，我设法让它工作，但由于我加载K

c#Kinect speechRecognitionEngine audioSource .net audio system.speech.recognition

Google Speech API + Go - 转录未知长度的音频流

我有一个视频通话的rtmp流，我想转录它。我在Go中创建了2个服务，我得到了结果，但它不是很准确，而且很多数据似乎丢失了。让我解释一下。我有一个transcode服务，我使用ffmpeg将视频转码为Linear16音频，并将输出字节放入PubSub队列以供transcribe服务处理。显然PubSub消息的大小是有限制的，我想在视频通话结束前开始转录。因此，我将转码后的数据分block为3秒的片段(长度不固定，看起来差不多)并将它们放入队列。数据的转码非常简单:varstdoutBuffercmd:=exec.Command("ffmpeg","-i",url,"-f","s16le"

Google Speech 34 code section go ffmpeg google-cloud-platform google-speech-api

Google Speech API + Go - 转录未知长度的音频流

我有一个视频通话的rtmp流，我想转录它。我在Go中创建了2个服务，我得到了结果，但它不是很准确，而且很多数据似乎丢失了。让我解释一下。我有一个transcode服务，我使用ffmpeg将视频转码为Linear16音频，并将输出字节放入PubSub队列以供transcribe服务处理。显然PubSub消息的大小是有限制的，我想在视频通话结束前开始转录。因此，我将转码后的数据分block为3秒的片段(长度不固定，看起来差不多)并将它们放入队列。数据的转码非常简单:varstdoutBuffercmd:=exec.Command("ffmpeg","-i",url,"-f","s16le"

Google Speech 34 code section go ffmpeg google-cloud-platform google-speech-api