Android 音频流 - 在 AudioTrack 上获取静态噪声

coder 2023-12-11 原文

我有一个在本地主机上运行的流媒体服务器。当我尝试从我的 Android 应用程序流式传输音频时。大多数时候我都会收到静电噪声( radio 里听到的那种)。有时完整的音频是静态噪声，有时是其中的一部分，有时音频播放得很好，所以我不确定出了什么问题。

这是来 self 的 android 应用程序的流代码:

new Thread(
                new Runnable() {
                    @Override
                    public void run() {
                        try {
                            URI uri = URI.create("http://192.168.1.6:5000/api/tts");
                            HttpURLConnection urlConnection = (HttpURLConnection) uri.toURL().openConnection();
                            urlConnection.setRequestMethod("POST");
                            urlConnection.setRequestProperty("Content-Type", "application/json");
                            urlConnection.setRequestProperty("x-access-token", credentials.getAccessToken());
                            urlConnection.setRequestProperty("Accept", "*");
                            urlConnection.setDoInput(true);
                            urlConnection.setDoOutput(true);
                            urlConnection.connect();
                            OutputStreamWriter osw = new OutputStreamWriter(urlConnection.getOutputStream());
                            String body = "{\"text\": \"" + text + "\", \"ttsLang\": \"" + language + "\"}";
                            Log.d("TTS_HTTP", body);
                            osw.write(body);
                            osw.flush();
                            osw.close();
                            Log.d("TTS_OUT", credentials.getAccessToken());
                            Log.d("TTS_OUT", urlConnection.getResponseCode() + " " + urlConnection.getResponseMessage());

                            // define the buffer size for audio track
                            int SAMPLE_RATE = 16000;
                            int bufferSize = AudioTrack.getMinBufferSize(SAMPLE_RATE, AudioFormat.CHANNEL_OUT_MONO,
                                    AudioFormat.ENCODING_PCM_16BIT);
                            if (bufferSize == AudioTrack.ERROR || bufferSize == AudioTrack.ERROR_BAD_VALUE) {
                                bufferSize = SAMPLE_RATE * 2;
                            }
                            bufferSize *= 2;

                            AudioTrack audioTrack = new AudioTrack(
                                    AudioManager.STREAM_MUSIC,
                                    SAMPLE_RATE,
                                    AudioFormat.CHANNEL_OUT_MONO,
                                    AudioFormat.ENCODING_PCM_16BIT,
                                    bufferSize*2,
                                    AudioTrack.MODE_STREAM);
                            byte[] buffer = new byte[bufferSize];
                            InputStream is = urlConnection.getInputStream();
                            int count;

                            audioTrack.play();
                            while ((count = is.read(buffer, 0, bufferSize)) > -1) {
                                Log.d("TTS_COUNT", count + "");
                                audioTrack.write(buffer, 0, count);
                            }
                            is.close();
                            audioTrack.stop();
                            audioTrack.release();
                        } catch (IOException e) {
                            e.printStackTrace();
                        }
                    }
                }
        ).start();

请帮我修改代码以解决问题。我无法像我之前描述的那样正确地听到声音。

此外，服务器响应很好，因为我可以使用 Python 代码将其保存到文件中。保存的文件正在正常播放。

>>> import requests
>>> import wave
>>> with wave.open("output.wav", "wb") as f:
...   f.setframerate(16000)  # 16khz
...   f.setnchannels(1)  # mono channel
...   f.setsampwidth(2)  # 16-bit audio
...   res = requests.post("http://192.168.1.6:5000/api/tts", headers={"x-access-token": token}, json={"text": "Hello, would you like to have some tea", "ttsLang": "en-us"}, stream=True)
...   for i in res.iter_content(chunk_size=16*1024):
...     f.writeframes(i)
...

更新:将输入流写入文件，然后从文件播放到音轨就可以了......

最佳答案

最后，我解决了这个问题。事实证明，AudioTrack 不喜欢向其写入不一致的数据量，并因此导致静态噪声。这是之前写入 AudioTrack 的字节计数序列，导致了问题 1248、3439、5152、5152、3834、...、823(不一致)。因此，我查看了 DataInputStream 的 readFully 方法并使用了它，它解决了静态噪声问题。字节计数序列现在看起来像 5152,5152,5152, ..., 5152(一致)。但现在的问题是读取由于 EOFException 而被跳过的剩余字节。所以我必须实现自己的方法来解决这个问题。

public class TTSInputStream extends DataInputStream {
    public TTSInputStream(InputStream in) {
        super(in);
    }

    public final int readFullyUntilEof(byte b[]) throws IOException {
        return readFullyUntilEof(b, 0, b.length);
    }

    public final int readFullyUntilEof(byte b[], int off, int len) throws IOException {
        if (len < 0)
            throw new IndexOutOfBoundsException();
        int n = 0;
        while (n < len) {
            int count = in.read(b, off + n, len - n);
            if (count < 0)
                break;
            n += count;
        }
        return n;
    }
}

我的最终代码现在是这样的:

new Thread(
                new Runnable() {
                    @Override
                    public void run() {
                        try {
                            URI uri = URI.create("http://192.168.1.6:5000/api/tts");
                            HttpURLConnection urlConnection = (HttpURLConnection) uri.toURL().openConnection();
                            urlConnection.setRequestMethod("POST");
                            urlConnection.setRequestProperty("Content-Type", "application/json");
                            urlConnection.setRequestProperty("x-access-token", credentials.getAccessToken());
                            urlConnection.setRequestProperty("Accept", "*");
                            urlConnection.setChunkedStreamingMode(bufferSize);
                            urlConnection.setDoInput(true);
                            urlConnection.setDoOutput(true);
                            urlConnection.connect();
                            OutputStreamWriter osw = new OutputStreamWriter(urlConnection.getOutputStream());
                            String body = "{\"text\": \"" + text + "\", \"ttsLang\": \"" + language + "\"}";
                            Log.d("TTS_HTTP", body);
                            osw.write(body);
                            osw.flush();
                            osw.close();
                            Log.d("TTS_OUT", credentials.getAccessToken());
                            Log.d("TTS_OUT", urlConnection.getResponseCode() + " " + urlConnection.getResponseMessage());

                            // define the buffer size for audio track
                            int SAMPLE_RATE = 16000;
                            int bufferSize = AudioTrack.getMinBufferSize(SAMPLE_RATE, AudioFormat.CHANNEL_OUT_MONO,
                                    AudioFormat.ENCODING_PCM_16BIT);
                            if (bufferSize == AudioTrack.ERROR || bufferSize == AudioTrack.ERROR_BAD_VALUE) {
                                bufferSize = SAMPLE_RATE * 2;
                            }
                            bufferSize *= 2;
                            TTSInputStream bis = new TTSInputStream(urlConnection.getInputStream());
                            AudioTrack audioTrack = new AudioTrack(
                                    AudioManager.STREAM_MUSIC,
                                    SAMPLE_RATE,
                                    AudioFormat.CHANNEL_OUT_MONO,
                                    AudioFormat.ENCODING_PCM_16BIT,
                                    bufferSize * 2,
                                    AudioTrack.MODE_STREAM);
                            byte[] buffer = new byte[bufferSize];
                            audioTrack.play();
                            int count;
                            while ((count = bis.readFullyUntilEof(buffer)) > 0) {
                                Log.d("TTS_COUNT", "Read " + count + " bytes.");
                                audioTrack.write(buffer, 0, buffer.length);
                            }
                            bis.close();
                            audioTrack.stop();
                            audioTrack.release();
                        } catch (IOException e) {
                            e.printStackTrace();
                        }
                    }
                }
        ).start();

现在我的音频播放效果很好，没有任何静电噪声。希望这可以帮助遇到与我相同问题的其他人。

关于Android 音频流 - 在 AudioTrack 上获取静态噪声，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55995880/

AudioTrack Android 34 urlConnection code streaming pcm

有关Android 音频流 - 在 AudioTrack 上获取静态噪声的更多相关文章

ruby - 简单获取法拉第超时 - 2
有没有办法在这个简单的get方法中添加超时选项？我正在使用法拉第3.3。Faraday.get(url)四处寻找，我只能先发起连接后应用超时选项，然后应用超时选项。或者有什么简单的方法？这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
ruby - 从 Ruby 中的主机名获取 IP 地址 - 2
我有一个存储主机名的Ruby数组server_names。如果我打印出来，它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点，但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类？输出:ge
ruby - 获取模块中定义的所有常量的值 - 2
我想获取模块中定义的所有常量的值:moduleLettersA='apple'.freezeB='boy'.freezeendconstants给了我常量的名字:Letters.constants(false)#=>[:A,:B]如何获取它们的值的数组，即["apple","boy"]？最佳答案为了做到这一点，请使用mapLetters.constants(false).map&Letters.method(:const_get)这将返回["a","b"]第二种方式:Letters.constants(false).map{|c
ruby-on-rails - 获取 inf-ruby 以使用 ruby 版本管理器 (rvm) - 2
我安装了ruby版本管理器，并将RVM安装的ruby实现设置为默认值，这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时，它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径？谢谢! 最佳答案我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣，可以在这里获取:http://github.com/senny/rvm.el
Ruby 从大范围中获取第 n 个项目 - 2
假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目？最佳答案一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做，或者如果你需要避免为前N个元素构建中间数组，你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit
ruby - Net::HTTP 获取源代码和状态 - 2
我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态，而无需发出第二个请求。有没有办法用另一种方法做到这一点？我一直在查看文档，但似乎找不到我要找的东西。最佳答案在我看来，除非您需要一些真正的低级访问或控制，否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur
ruby - 没有类方法获取 Ruby 类名 - 2
如何在Ruby中获取BasicObject实例的类名？例如，假设我有这个:classMyObjectSystem我怎样才能使这段代码成功？编辑:我发现Object的实例方法class被定义为returnrb_class_real(CLASS_OF(obj));。有什么方法可以从Ruby中使用它？最佳答案我花了一些时间研究irb并想出了这个:classBasicObjectdefclassklass=class这将为任何从BasicObject继承的对象提供一个#class您可以调用的方法。编辑评论中要求的进一步解释:假设你有对象
ruby-on-rails - 如何在 Gem 中获取 Rails 应用程序的根目录 - 2
是否可以在应用程序中包含的gem代码中知道应用程序的Rails文件系统根目录？这是gem来源的示例:moduleMyGemdefself.included(base)putsRails.root#returnnilendendActionController::Base.send:include,MyGem谢谢，抱歉我的英语不好最佳答案我发现解决类似问题的解决方案是使用railtie初始化程序包含我的模块。所以，在你的/lib/mygem/railtie.rbmoduleMyGemclassRailtie使用此代码，您的模块将在
ruby - 如何使用 CarrierWave 从 S3 获取真实文件 - 2
我有一个应用程序可以读取文件的内容并为其编制索引。我将它们存储在磁盘本身中，但现在我使用的是AmazonS3，因此以下方法不再适用。事情是这样的:defperform(docId)@document=Document.find(docId)if@document.file?#Youshould'tcreateanewversion@document.versionlessdo|doc|@document.file_content=Cloudoc::Extractor.new.extract(@document.file.file)@document.saveendendend@docu
【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2
在应用开发中，有时候我们需要获取系统的设备信息，用于数据上报和行为分析。那在鸿蒙系统中，我们应该怎么去获取设备的系统信息呢，比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况，一种是设备信息的获取，一种是系统信息的获取。1.1、获取设备信息获取设备信息，鸿蒙的SDK包为我们提供了DeviceInfo类，通过该类的一些静态方法，可以获取设备信息，DeviceInfo类的包路径为：ohos.system.DeviceInfo.具体的方法如下：ModifierandTypeMethodDescriptionstatic StringgetAbiList()Obt

Android 音频流 - 在 AudioTrack 上获取静态噪声

有关Android 音频流 - 在 AudioTrack 上获取静态噪声的更多相关文章

随机推荐