jjzjj

downsampling

全部标签

javascript - 将 PCM 音频从 44100 下采样到 8000

我从事音频识别演示已有一段时间了,api需要我传递采样率为8000或16000的.wav文件,所以我必须对其进行下采样。我尝试了以下两种算法。虽然他们都没有像我希望的那样解决问题,但结果存在一些差异,我希望这会使它更清楚。这是我的第一次尝试,当sampleRate%outputSampleRate=0时效果很好,但是当outputSampleRate=8000或1600时,结果音频文件是silent(表示输出数组的每个元素的值为0):functioninterleave(inputL){varcompression=sampleRate/outputSampleRate;varleng

Java - 下采样wav音频文件

您好,我需要将wav音频文件的采样率从44.1kHz降低到8kHz。我必须使用字节数组手动完成所有工作……这是出于学术目的。我目前正在使用2个类,Sink和Source,来弹出和压入字节数组。一切顺利,直到我到达需要使用线性插值对数据block进行下采样的部分。由于我正在从44100赫兹下采样到8000赫兹,我该如何插入一个包含大约128000000字节的字节数组?现在我根据i%2==0、i%2==1和i%80==0弹出5、6或7个字节,并将这5、6或7个字节的平均值推送到新文件中.结果确实是一个比原来小的音频文件,但它不能在windowsmediaplayer上播放(说是读取文件时出

android - 如何正确地对图像进行下采样?

背景创建一个包含大量高质量图像的应用程序,我决定将图像缩小到所需的大小(这意味着如果图像比屏幕大,我将其缩小)。问题我注意到在某些设备上,如果图像被缩小,它们会变得模糊/像素化,但在相同的设备上,对于相同的目标imageView大小,如果图像没有被缩小,它们看起来就很好。我尝试过的我决定进一步检查这个问题,并创建了一个小的POC应用程序来显示这个问题。在向您展示代码之前,这里有一个我正在谈论的演示:很难看出区别,但可以看出第二个有点像素化。这可以显示在任何图像上。publicclassMainActivityextendsActivity{@Overrideprotectedvoido

python - 对列表中的条目数进行下采样(无插值)

我有一个包含许多条目的Python列表,我需要使用以下任一方法对其进行缩减采样:最大行数。例如,将包含1234个条目的列表限制为1000个。原始行的比例。例如,将列表的长度设为原始长度的1/3。(我需要能够同时使用两种方式,但一次只能使用一种)。我相信对于最大行数,我可以计算所需的比例并将其传递给比例缩小器:defdownsample_to_max(self,rows,max_rows):returndownsample_to_proportion(rows,max_rows/float(len(rows)))...所以我真的只需要一个下采样函数。有什么提示吗?编辑:该列表包含对象,而

上采样(upsample/upsacle)下采样(downsample/downscale)的作用

下采样的作用:①降维,减少图片尺寸,减轻计算量②对卷积得到的FeatureMapFeatureMap进行进一步压缩通俗的说,实际上就是卷积层之间的池化操作。作用:通过最大池化或者平均池化从而减少了特征,减少了参数的数量,且降低了卷积网络计算的复杂度;实际上就是过滤掉那些作用小、信息冗余的特征,保留关键信息下图左边是经过卷积得到的一个FeatureMap,卷积后的每一个像素点我理解成:将原始图像中卷积核大小的所有像素点特征糅合到了一个像素点。通过步长为2的最大池化,将被激活程度最大(value最大)的特征筛选出来,而其余相对较小的特征则被去掉,达到降低特征维度的作用。同时还增大了整个网络图所覆盖