jjzjj

ios - 如何在 iOS 9 上获取所有声音的列表?

获取“所有”AVSpeechSynthesisVoice对象列表的标准方法是请求它:[AVSpeechSynthesisVoicespeechVoices]但是,这只会显示每个语言区域对的唯一默认语音。例如对于en-US:"Language:en-US,Name:Samantha,Quality:Default",如果我在“设置”应用中查看一般→辅助功能→语音→语音→英语我看到我选择了“SiriFemale(Enhanced)”,但无法从代码中选择该声音。完整列表是所以最大的问题是:我该如何选择,例如Alex或SiriFemale作为来自代码的声音? 最佳答

ios - 如何通过 Objective-C 中的 Speech 框架实现语音转文本?

我想使用iOS语音框架在我的Objective-C应用程序中进行语音识别。我找到了一些Swift示例,但在Objective-C中找不到任何内容。是否可以从Objective-C访问此框架?如果是,怎么办? 最佳答案 在花了足够多的时间寻找Objective-C示例之后——甚至在Apple文档中——我找不到任何像样的东西,所以我自己想出了办法。头文件(.h)/*!*ImporttheSpeechframework,assigntheDelegateanddeclarevariables*/#import@interfaceViewC

ios - 如何通过 Objective-C 中的 Speech 框架实现语音转文本?

我想使用iOS语音框架在我的Objective-C应用程序中进行语音识别。我找到了一些Swift示例,但在Objective-C中找不到任何内容。是否可以从Objective-C访问此框架?如果是,怎么办? 最佳答案 在花了足够多的时间寻找Objective-C示例之后——甚至在Apple文档中——我找不到任何像样的东西,所以我自己想出了办法。头文件(.h)/*!*ImporttheSpeechframework,assigntheDelegateanddeclarevariables*/#import@interfaceViewC

Microsoft Speech Platform 运行库和语音包

MicrosoftSpeechPlatform运行库和语音包运行库下载huihui语音包运行库下载32位:https://download.microsoft.com/download/A/6/4/A64012D6-D56F-4E58-85E3-531E56ABC0E6/x86_SpeechPlatformRuntime/SpeechPlatformRuntime.msi64位:https://download.microsoft.com/download/A/6/4/A64012D6-D56F-4E58-85E3-531E56ABC0E6/x64_SpeechPlatformRuntime/

ios - 使用 Speech kit ios 时由于未捕获的应用程序崩溃而终止应用程序

我在实现语音转文本时遇到了这个错误:Terminatingappduetouncaughtexception'com.apple.coreaudio.avfaudio',reason:'requiredconditionisfalse:_recordingTap==nil'和:ERROR:[0x1b2df5c40]>avae>AVAudioNode.mm:565:CreateRecordingTap:requiredconditionisfalse:_recordingTap==nil这是我的viewController的代码:publicclassViewController:UIV

ios - 使用 Speech kit ios 时由于未捕获的应用程序崩溃而终止应用程序

我在实现语音转文本时遇到了这个错误:Terminatingappduetouncaughtexception'com.apple.coreaudio.avfaudio',reason:'requiredconditionisfalse:_recordingTap==nil'和:ERROR:[0x1b2df5c40]>avae>AVAudioNode.mm:565:CreateRecordingTap:requiredconditionisfalse:_recordingTap==nil这是我的viewController的代码:publicclassViewController:UIV

c# - 在 Kinect 中使用 System.Speech

我正在为一个大学项目开发​​语音到文本字幕应用程序的原型(prototype)。我稍后将在我的项目中使用手势识别,所以我认为使用Kinect作为麦克风源而不是使用额外的麦克风是个好主意。我的应用程序的想法是识别自发的语音,例如长而复杂的句子(我知道语音听写不会很完美,但不会)。我见过许多Kinect语音示例,其中引用了Microsoft.Speech,但没有引用System.Speech。由于我需要训练语音引擎并将DictationGrammar加载到语音识别引擎中,Microsoft.Speech是我唯一的选择。在使用Kinect作为直接麦克风音频源时,我设法让它工作,但由于我加载K

c# - 在 Kinect 中使用 System.Speech

我正在为一个大学项目开发​​语音到文本字幕应用程序的原型(prototype)。我稍后将在我的项目中使用手势识别,所以我认为使用Kinect作为麦克风源而不是使用额外的麦克风是个好主意。我的应用程序的想法是识别自发的语音,例如长而复杂的句子(我知道语音听写不会很完美,但不会)。我见过许多Kinect语音示例,其中引用了Microsoft.Speech,但没有引用System.Speech。由于我需要训练语音引擎并将DictationGrammar加载到语音识别引擎中,Microsoft.Speech是我唯一的选择。在使用Kinect作为直接麦克风音频源时,我设法让它工作,但由于我加载K

Google Speech API + Go - 转录未知长度的音频流

我有一个视频通话的rtmp流,我想转录它。我在Go中创建了2个服务,我得到了结果,但它不是很准确,而且很多数据似乎丢失了。让我解释一下。我有一个transcode服务,我使用ffmpeg将视频转码为Linear16音频,并将输出字节放入PubSub队列以供transcribe服务处理。显然PubSub消息的大小是有限制的,我想在视频通话结束前开始转录。因此,我将转码后的数据分block为3秒的片段(长度不固定,看起来差不多)并将它们放入队列。数据的转码非常简单:varstdoutBuffercmd:=exec.Command("ffmpeg","-i",url,"-f","s16le"

Google Speech API + Go - 转录未知长度的音频流

我有一个视频通话的rtmp流,我想转录它。我在Go中创建了2个服务,我得到了结果,但它不是很准确,而且很多数据似乎丢失了。让我解释一下。我有一个transcode服务,我使用ffmpeg将视频转码为Linear16音频,并将输出字节放入PubSub队列以供transcribe服务处理。显然PubSub消息的大小是有限制的,我想在视频通话结束前开始转录。因此,我将转码后的数据分block为3秒的片段(长度不固定,看起来差不多)并将它们放入队列。数据的转码非常简单:varstdoutBuffercmd:=exec.Command("ffmpeg","-i",url,"-f","s16le"