jjzjj

ios - 带有 BT.709 矩阵的 H.264 编码视频是否包含任何 Gamma 调整?

coder 2024-01-22 原文

我已阅读 BT.709 spec很多次,只是不清楚的是编码的 H.264 比特流是否应该将任何 Gamma 曲线应用于编码数据?请注意在 BT.709 规范中特别提到了类似 Gamma 的公式。 Apple 提供了从 CoreVideo 提供的缓冲区读取 YUV 数据的 OpenGL 或 Metal 着色器示例,它们不进行任何类型的 gamma 调整。正在读取和处理 YUV 值,就好像它们是简单的线性值一样。我还检查了 ffmpeg 的源代码,发现在 BT.709 缩放步骤之后没有应用 Gamma 调整。我然后created a test video只有两个线性灰度颜色 5 和 26 对应于 2% 和 10% 级别。当使用 ffmpeg 和 iMovie 转换为 H.264 时,输出 BT.709 值为 (YCbCr) (20 128 128) 和 (38 128 128),这些值与 BT.709 转换矩阵的输出完全匹配,没有任何 Gamma 调整。

可以在 Quicktime Gamma Bug 找到有关该主题的大量背景资料。 .似乎 Quicktime 和 Adob​​e 编码器的一些历史问题不正确地进行了不同的 gamma 调整,结果导致视频流在不同的播放器上看起来很糟糕。这真的很令人困惑,因为如果你比较 sRGB ,它清楚地指示了如何应用 Gamma 编码然后对其进行解码以在 sRGB 和线性之间进行转换。如果在创建 h.264 数据流时的矩阵步骤之后没有应用 Gamma 调整,为什么 BT.709 会详细介绍相同类型的 Gamma 调整曲线? h.264 流中的所有颜色步骤是否都意味着编码为直线( Gamma 1.0)值?

如果特定的示例输入会让事情变得更清楚,我附上了 3 个颜色条图像,不同颜色的确切值可以使用这些图像文件显示在图像编辑器中。

第一个图像在 sRGB 颜色空间中,并被标记为 sRGB。



第二张图像已转换为线性 RGB 颜色空间,并使用线性 RGB 配置文件进行标记。



这第三张图像已通过来自 elles_icc_profiles 的 Rec709-elle-V4-rec709.icc 转换为 REC.709 配置文件级别.这似乎是模拟 BT.709 中描述的“相机” Gamma 所需要做的事情。



请注意右下角 (0x555555) 的 sRGB 值如何变为线性 RGB (0x171717) 以及 BT.709 Gamma 编码值如何变为 (0x464646)。不清楚的是我是否应该将线性 RGB 值传递给 ffmpeg,或者我是否应该传递一个已经 BT.709 Gamma 编码的值,然后需要在客户端中对其进行解码,然后再进行线性转换矩阵步骤以返回 RGB .

更新:

根据反馈,我更新了基于 C 的实现和 Metal 着色器,并作为 iOS 示例项目上传到 github MetalBT709Decoder .

编码一个归一化的线性 RGB 值是这样实现的:

static inline
int BT709_convertLinearRGBToYCbCr(
                            float Rn,
                            float Gn,
                            float Bn,
                            int *YPtr,
                            int *CbPtr,
                            int *CrPtr,
                            int applyGammaMap)
{
  // Gamma adjustment to non-linear value

  if (applyGammaMap) {
    Rn = BT709_linearNormToNonLinear(Rn);
    Gn = BT709_linearNormToNonLinear(Gn);
    Bn = BT709_linearNormToNonLinear(Bn);
  }

  // https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.709-6-201506-I!!PDF-E.pdf

  float Ey = (Kr * Rn) + (Kg * Gn) + (Kb * Bn);
  float Eb = (Bn - Ey) / Eb_minus_Ey_Range;
  float Er = (Rn - Ey) / Er_minus_Ey_Range;

  // Quant Y to range [16, 235] (inclusive 219 values)
  // Quant Eb, Er to range [16, 240] (inclusive 224 values, centered at 128)

  float AdjEy = (Ey * (YMax-YMin)) + 16;
  float AdjEb = (Eb * (UVMax-UVMin)) + 128;
  float AdjEr = (Er * (UVMax-UVMin)) + 128;

  *YPtr = (int) round(AdjEy);
  *CbPtr = (int) round(AdjEb);
  *CrPtr = (int) round(AdjEr);

  return 0;
}

从 YCbCr 解码到线性 RGB 的实现如下:
static inline
int BT709_convertYCbCrToLinearRGB(
                             int Y,
                             int Cb,
                             int Cr,
                             float *RPtr,
                             float *GPtr,
                             float *BPtr,
                             int applyGammaMap)
{
  // https://en.wikipedia.org/wiki/YCbCr#ITU-R_BT.709_conversion
  // http://www.niwa.nu/2013/05/understanding-yuv-values/

  // Normalize Y to range [0 255]
  //
  // Note that the matrix multiply will adjust
  // this byte normalized range to account for
  // the limited range [16 235]

  float Yn = (Y - 16) * (1.0f / 255.0f);

  // Normalize Cb and CR with zero at 128 and range [0 255]
  // Note that matrix will adjust to limited range [16 240]

  float Cbn = (Cb - 128) * (1.0f / 255.0f);
  float Crn = (Cr - 128) * (1.0f / 255.0f);

  const float YScale = 255.0f / (YMax-YMin);
  const float UVScale = 255.0f / (UVMax-UVMin);

  const
  float BT709Mat[] = {
    YScale,   0.000f,  (UVScale * Er_minus_Ey_Range),
    YScale, (-1.0f * UVScale * Eb_minus_Ey_Range * Kb_over_Kg),  (-1.0f * UVScale * Er_minus_Ey_Range * Kr_over_Kg),
    YScale, (UVScale * Eb_minus_Ey_Range),  0.000f,
  };

  // Matrix multiply operation
  //
  // rgb = BT709Mat * YCbCr

  // Convert input Y, Cb, Cr to normalized float values

  float Rn = (Yn * BT709Mat[0]) + (Cbn * BT709Mat[1]) + (Crn * BT709Mat[2]);
  float Gn = (Yn * BT709Mat[3]) + (Cbn * BT709Mat[4]) + (Crn * BT709Mat[5]);
  float Bn = (Yn * BT709Mat[6]) + (Cbn * BT709Mat[7]) + (Crn * BT709Mat[8]);

  // Saturate normalzied linear (R G B) to range [0.0, 1.0]

  Rn = saturatef(Rn);
  Gn = saturatef(Gn);
  Bn = saturatef(Bn);

  // Gamma adjustment for RGB components after matrix transform

  if (applyGammaMap) {
    Rn = BT709_nonLinearNormToLinear(Rn);
    Gn = BT709_nonLinearNormToLinear(Gn);
    Bn = BT709_nonLinearNormToLinear(Bn);
  }

  *RPtr = Rn;
  *GPtr = Gn;
  *BPtr = Bn;

  return 0;
}

我相信这个逻辑是正确实现的,但我很难验证结果。当我生成一个包含经过 Gamma 调整的颜色值(osxcolor_test_image_24bit_BT709.m4v)的 .m4v 文件时,结果按预期出现。但是我发现了一个像 (bars_709_Frame01.m4v) 这样的测试用例 here似乎不起作用,因为彩条值似乎被编码为线性(没有 Gamma 调整)。

对于 SMPTE 测试模式,0.75 灰度级是线性 RGB (191 191 191),如果该 RGB 没有经过 Gamma 调整被编码为 (Y Cb Cr) (180 128 128),或者比特流中的值是否应该显示为经过 Gamma 调整(Y Cb Cr) (206 128 128)?

(跟进)
在对这个 gamma 问题进行了额外研究之后,很明显 Apple 在 AVFoundation 中实际所做的是使用 1.961 gamma 函数。使用 AVAssetWriterInputPixelBufferAdaptor、使用 vImage 或使用 CoreVideo API 进行编码时就是这种情况。这个分段 Gamma 函数定义如下:
#define APPLE_GAMMA_196 (1.960938f)

static inline
float Apple196_nonLinearNormToLinear(float normV) {
  const float xIntercept = 0.05583828f;

  if (normV < xIntercept) {
    normV *= (1.0f / 16.0f);
  } else {
    const float gamma = APPLE_GAMMA_196;
    normV = pow(normV, gamma);
  }

  return normV;
}

static inline
float Apple196_linearNormToNonLinear(float normV) {
  const float yIntercept = 0.00349f;

  if (normV < yIntercept) {
    normV *= 16.0f;
  } else {
    const float gamma = 1.0f / APPLE_GAMMA_196;
    normV = pow(normV, gamma);
  }

  return normV;
}

最佳答案

您最初的问题:带有 BT.709 矩阵的 H.264 编码视频是否包含任何 Gamma 调整?

编码的视频仅包含 Gamma 调整 - 如果您输入编码器 Gamma 调整值。

H.264 编码器不关心传输特性。
所以如果你压缩线性然后解压缩 - 你会得到线性。
所以如果你用 Gamma 压缩然后解压缩 - 你会得到 Gamma 。

或者,如果您的位是用 Rec 编码的。 709 传递函数 - 编码器不会改变 Gamma 。

但是您可以将 H.264 流中的传输特性指定为元数据。 (ITU-T H.264 (04/2017) E.1.1 VUI 参数语法建议书)。因此,编码流携带了色彩空间信息,但不用于编码或解码。

我会假设 8 位视频总是包含一个非线性传递函数。否则你会相当不明智地使用 8 位。

如果您转换为线性来做效果和合成 - 我建议增加位深度或线性化为浮点数。

颜色空间由原色、传递函数和矩阵系数组成。
Gamma 调整在传递函数中编码(而不是在矩阵中)。

关于ios - 带有 BT.709 矩阵的 H.264 编码视频是否包含任何 Gamma 调整?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53911662/

有关ios - 带有 BT.709 矩阵的 H.264 编码视频是否包含任何 Gamma 调整?的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  3. ruby - 检查 "command"的输出应该包含 NilClass 的意外崩溃 - 2

    为了将Cucumber用于命令行脚本,我按照提供的说明安装了arubagem。它在我的Gemfile中,我可以验证是否安装了正确的版本并且我已经包含了require'aruba/cucumber'在'features/env.rb'中为了确保它能正常工作,我写了以下场景:@announceScenario:Testingcucumber/arubaGivenablankslateThentheoutputfrom"ls-la"shouldcontain"drw"假设事情应该失败。它确实失败了,但失败的原因是错误的:@announceScenario:Testingcucumber/ar

  4. ruby - 检查数组是否在增加 - 2

    这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife

  5. ruby-on-rails - link_to 不显示任何 rails - 2

    我试图在索引页中创建一个超链接,但它没有显示,也没有给出任何错误。这是我的index.html.erb代码。ListingarticlesTitleTextssss我检查了我的路线,我认为它们也没有问题。PrefixVerbURIPatternController#Actionwelcome_indexGET/welcome/index(.:format)welcome#indexarticlesGET/articles(.:format)articles#indexPOST/articles(.:format)articles#createnew_articleGET/article

  6. ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2

    我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案

  7. ruby-on-rails - Ruby 检查日期时间是否为 iso8601 并保存 - 2

    我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby​​是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查

  8. ruby - 检查日期是否在过去 7 天内 - 2

    我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/

  9. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  10. ruby-on-rails - RSpec:避免使用允许接收的任何实例 - 2

    我正在处理旧代码的一部分。beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)endRubocop错误如下:Avoidstubbingusing'allow_any_instance_of'我读到了RuboCop::RSpec:AnyInstance我试着像下面那样改变它。由此beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)end对此:let(:sport_

随机推荐