11月19日
By 1月时特约编辑
专题文章

多路分配器 '18亮点:编解码器和压缩的未来

多路分配器视频工程师年会是视频工程师开的吗. 将于10月17日和18日在旧金山举行, 会议包括31位演讲者，他们以快速的方式进行了10到30分钟不等的演讲. 用一个老生常谈但恰当的比喻, 这种体验就像从消防水管里喝水:几乎不可能实时理解和消化. 我参加了今年的第一天，并从第二天开始通过视频观看了几场演讲视频库在抽搐.tv.

总的来说，这些视频是各种主题的宝贵信息来源. 在这个故事中, 我将回顾一些我觉得最有趣的演讲, 这对我来说显然是独一无二的. 在浏览我下面的列表之前，我强烈建议你回顾一下演讲者和主题的完整列表. 除了我下面讨论的那些，你可能还会发现很多你想看的演讲, 按呈现顺序列出.

第一天脱毛

富博发表了题为“2018年国际足联世界杯超高清直播与HDR”的演讲，会议以轰动性的方式开始.比利·罗梅罗和托马斯·辛博斯基. 该演习的目的是提供一个四阶HEVC编码阶梯，范围从2160p (16 Mbps)到720p (3 Mbps).5mbps，全部使用HDR10 HDR元数据(图1). 整个工作流程是基于云的，包括在AWS C5的云中对70 Mbps的输入提要进行转码.18个X-Large实例.

图1. 实例细节和编码阶梯用于FIFA世界杯4K与HDR10交付.

在演讲中, 演讲者为任何想要创造类似体验的视频工程师提供了一个蓝图, 覆盖网络设置的收购, 编码器的选择, 包装与储存, 客户和玩家的考虑, 包括在亚马逊Fire TV/安卓 TV上的经验教训, Roku, Chromecast超, 以及使用ExoPlayer的Apple TV设备, 动静脉, Roku, 沙加, 还有Bitmovin的玩家. 最终, 主持人建议与会者“快速失败”, 快速学习, 关注用户体验.”

我的下一个演讲是Mux的Ben Dodson和Nick Chadwick的“逐标题编码后该做什么”. 在快节奏的谈话中, Dodson和Chadwick回顾了标题编码的历史以及许多基础理论和挑战. 然后两人详细介绍了Mux如何使用机器学习构建自己的标题编码功能, 以及他们如何将标题编码扩展到场景编码, 哪个启用了实时标题编码. 这是一个密集且具有技术挑战性的演示文稿，任何设计每个标题或每个场景编码器的人都会发现它非常宝贵.

可感知的视频质量是我们工作的核心, Twitter的Sebastiaan Van Leuven的演讲“移动设备的主观视频质量评估”直面了这个问题. 在他十分钟的演讲中, Van Leuven首先回顾了测量视频质量的两种常用技术, 单刺激和双刺激平均意见评分(MOS). 短暂的, 单一刺激显示一个单一的样本，并要求一个五分制的评级, 而双刺激先显示原始视频，再显示编码后的样本, 并要求类似的评级. 虽然部署很简单, 这两种测试方法在精确性和一致性方面得分都很低, 不同的测试者对同一视频进行评级，同一测试者在不同的日子对同一视频进行评级.

提高一致性和可靠性, Twitter开发了一种自适应配对比较(APC)，它显示两个样本，并询问受试者哪个更好, 就像验光师问的那样, 哪个看起来更好?, 左或右?“这种测试方法可以产生更准确和可重复的结果，但也非常耗时. Twitter方法的新颖之处在于使用粒子滤波模拟的主动学习过程，简化了样本选择. 简短的演示提供了一个概述，Van Leuven补充了一个链接到博客文章.

加速AV1播放与dav1d

开放媒体联盟(AOM)的AV1编解码器于2018年年中推出，但硬件加速播放预计要到2020年年中才能实现. 这使得软件解码器的效率对于未来24个月的部署至关重要. 许多使用AOM解码器libbaom的AV1解码的初始测试，包括我的自己的结果显示，它的速度缓慢且效率低下. 出于这个原因, AOM赞助了VideoLAN开发的一种名为dav1d的新的开源AV1解码器, VLC, 和FFmpeg社区.

在他们题为“介绍戴维”的演讲中, “一个新的AV1解码器,VideoLAN的Jean-Baptiste Kempf和Two Oriole的Ronald Bultje描述了该项目的目标, 哪一个包含更小的源代码, 更小的二进制可执行文件, 运行时内存占用比libaom小. 在演讲中, Bultje回顾了大卫迄今为止的表现, 并预测，一旦全面实施, 它将产生与H相似的解码性能.264、HEVC和VP9. 虽然这与硬件中支持的编解码器的解码效率不匹配, 它肯定会将AV1的使用范围扩展到libaom无法承受的范围. 根据这个博客帖子, Dav1d目前工作在x86上, x64, v7, ARMv8硬件和运行在Windows上, Linux, macOS, 安卓, 和iOS.

正如RealEye Media的大卫·哈桑在他的演讲中指出的那样, “Multi-CDN Jump Start, 不要把所有的东西放在一个篮子里,“使用单个CDN来传递流量意味着单点故障, 当流式传输是关键任务时，这是不可接受的风险. 哈桑也提到过, 单个CDN也可能无法为许多用户提供最佳体验, 而且可能不符合成本效益.

这些观点, Hassoun随后指出了使用多个cdn的常见问题, 比如直播的同步起源, 交通路由, 为QoS和QoE接收可操作的实时数据, 以及跨CDN访问安全. 然后, 他对这些问题提出了多种解决方案，以及如何构建多个CDN支持，一直到manifest文件创建. 在规定的十分钟内讲了很多内容, 对于想要尝试多种CDN交付的人来说，这个演示文稿是必看的(图2)。.

图2. 添加多个CDN支持一个动态主播放列表.

减少玻璃到玻璃的延迟

玻璃到玻璃的延迟是许多现场活动制作人一直关注的问题. 虽然有几种专有方法可以减少实时延迟, 比如Wowza流媒体云的超低延迟服务, 这可能不适用于大型活动所需的规模.

Akamai的Will Law在题为“Chunky Monkey”的演讲中全面描述了一种获得关注的解决方案，即Chunked CMAF, 使用分块编码、分块传输的CMAF为大规模观众带来低延迟直播.图3说明了这种方法. 最重要的是传递细分市场的传统方式, 什么是等到它完全定型并储存起来. 底部显示了打包成块的相同媒体样本，这些样本可以在完整段编码和保存之前交付, 这大大减少了延迟.