-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

如何最大化你的元数据

文章特色图片

本文发表于2012年2月/ 3月号 流媒体 杂志, 一年一度的 流媒体行业资料手册.

元数据并不是原始资料读者最感兴趣的话题, 但如果你想让人们对你的内容产生兴趣,这是最重要的一点.

为什么要麻烦地提取元数据呢? 元数据的创建和提取非常费力, 即使有大量的自动化工具, 主要是因为这些工具容易受到许多误报的影响,或者被视频或音频轨道中的元素所混淆.

尽管如此,花时间为在线视频创建或提取元数据还是有关键原因的.

  1. 使特定的片段更容易找到. 我们通常认为在线视频是一组带有标签的资产, 标题, 和描述, 但是,如果有适当的元数据可用,还有许多其他详细的元数据选项可以帮助企业资产管理或生产工作流.
  2. 为客户提供新的服务. 这个词(货币化)经常被用来解释视频元数据提取带来的痛苦, 但事实证明这是真的. 思想公平运动公司. (TEM), 一家为运动队提供实时和按需元数据创建和提取的公司, 发现如果提供详细的元数据进行搜索,用户观看经典游戏内容的时间会明显增加. 在一个案例中,平均参与时间从不到20秒跃升到几分钟(参见我们的元数据购买者指南中的TEM示例)。.
  3. 使离线存储的归档和检索更容易. 超越后期工作流程和消费者媒体消费, 元数据也是数字文件存储中保存相关方面的关键. 企业环境或后期制作设施中的许多文件是脱机存储的, 因此,查找这些文件的唯一可用信息是与文件相关的元数据和代表视频文件的偶尔的静态图像.
  4. 使文件内和外部元数据符合标准格式(XML),以便在保存或货币化活动中使用. 如果你还没有听说过DASH,你很快就会知道. 这种基于xml的媒体表示描述(MPD)是MPEG标准委员会试图以一致的方式表示某些类型的元数据,以便任何符合dash的播放器都可以解码以一种自适应比特率解决方案编码的内容.

不同的需求,不同的方法

提取或创建元数据有三种主要方法. Telestream公司., 提供端到端编码和转码解决方案的公司, 几年前发表了一份白皮书,其中介绍了创建元数据的简明三步方法. 步骤很简单:

  1. 从源文件中的封闭字幕和其他嵌入视频信息中提取元数据.
  2. 当现有元数据存在时重用它.
  3. 创建注释或标记.

元数据提示图前两步听起来没那么痛苦, 但我们将涵盖所有三种方法,因为手动创建注释或标记可以带来显著的货币化和资产管理好处. 在现实中, 鉴于语音到文本和视觉模式识别的有限一致性, 即使是那些依赖于自动元数据提取的人,也会发现他们需要手动创建元数据或对自动元数据捕获进行修正.

以下是在进行元数据提取时需要考虑的一些简单技巧和提示:

1. 语音到文本的转换只需要对大词准确. 一般演讲, 对于语音到文本转换系统来说,最难识别的单词是标识符.g.,她,他,一个,那个)和具体的型号或零件号. 如果你试着在iPhone 4S上给Siri读一个型号, 你会发现Siri很难理解你怎么说NG1TZ1. 然而那些大词, 比如飞机或烤面包机, 很容易识别, 这些词将被用于搜索和检索视频片段.

相反,成绩单可以有细节,但你应该确保它是准确的. 对于像YouTube这样的视频网站, 如果你有成绩单的话, 上传成绩单后打开字幕功能. 根据YouTube, 这可以帮助你的发现性,因为它将提供更多的数据点来索引你的视频.

2. 找到一个解决方案,将一个单词或短语与视频中的适当位置同步. 使用关键字或元标签来描述整个视频剪辑是很好的, 但如果这段视频有一小时长, 如果大多数用户必须查看整个视频才能找到一个单词或短语,他们会感到非常沮丧. 处理这个问题的最好方法之一是通过封闭的标题信息, which is already embedded into many pieces of content; just make sure your metadata extraction system keeps the synchronization intact.

3. 噪音问题. 尽可能将人声与背景噪音或其他音轨隔离开来. 没有什么比背景噪音更快地破坏语音到文本元数据提取的准确性了, 无论是音乐, 声音效果, 或者麦克风放得不好. 从背景谈话到头顶太吵的公共广播系统, 额外声音的存在使大多数语音转文本系统感到困惑, 将准确率降至60%以下.

4. 尽可能使用嵌入元数据. Telestream指出了一些视频格式, 特别是那些用于网络流媒体或编辑, 可能已经包含元数据,如单个场景的描述. 在某些情况下,可以保留和提取这些信息以方便搜索. 然而,并不是每一条信息都会被保存下来.

5. 不要害怕手动输入信息.

当涉及到面部识别, 许多视频索引工具在捕捉全裸镜头(即拍摄对象出现在屏幕上的镜头)方面做得不错, 独自一人, 面对镜头). 当涉及到侧面照片或团体照片, 能够处理多个面孔的系统要少得多. 随着时间的推移,这种情况将会改变——我们已经看到静态照片系统在集体照片中识别多人的情况有所上升——但就目前而言, 不要害怕为视频中的关键点手动添加元数据. 关于视频内容的更多细节通常等于视频本身的更多价值.

6. 对于优质内容, 尤指戏剧或电视内容, 考虑购买对现有元数据的访问权. 也就是说,当你被允许的时候. 在去年的一篇文章中, 我们曾提到,颗粒元数据正变得越来越有价值,以至于电影公司会向IMDb等网站出售一些高级元数据内容的访问权,同时将颗粒元数据内容作为竞争敏感因素保留下来.

7. 找到源头. 说到在线视频平台, YouTube有一套不同于iTunes的搜索要求, 它的要求与Vimeo不同, 甚至是你平台的应用程序商店.

了解需要哪些元数据以及要避免哪些陷阱, 访问源-特定内容网络的博客文章或常见问题解答. 例如,YouTube有一组非常独特的搜索字段. 被称为继母公司谷歌之后的第二大搜索引擎, YouTube的产品经理在一篇名为“给合作伙伴的建议:文字”的博客文章中推荐了一些关键点, 单词, 单词!!“(http://bit.ly / vSUZI1).

YouTube最不喜欢的是垃圾邮件. 如果YouTube算法在视频描述中发现重复的单词, title, 或者标签列表,或者甚至是在你的频道中的许多视频中,对特定内容的搜索成功率都会下降.

这篇博文警告说:“不要在你的描述或标题中重复词语,这对你没有帮助。. “而是使用不同的词和变体,用户可能会搜索到你的视频.”

市场上的许多视频格式(容器)支持文件内元数据,包括定时文本选项,如字幕. 而视频中所说的话则是文件内元数据的主要候选内容, 有些内容最好保存在文件之外并加以引用.

8. 使用桌面视频播放器查找文件中已经存在的元数据. 虽然可以从Windows XP的详细列表视图中收集一些元数据, Vista, 或7(或Mac OS X上的“获取信息”), 视频播放器是查找视频文件中已有元数据(称为文件内元数据)的最佳方式。.

适用于Mac OS X用户, 例如, QuickTime has a Movie Inspector (Choose Window > Show Inspector or press Command-I) that shows a number of pieces of metadata:

  • 文件名称 
  • 专辑的名字 
  • 版权(如有) 
  • 源(文件位置或URL) 
  • 格式(编解码器,比特率,通道数)MHz速率(音频)

更详细地说,像Metadata Hootenanny(为什么? 我们不知道)由3ivx技术公司发行. 有限公司. 是否允许附加元数据(包括url), 比如封面或IMDb链接——添加到文件中. Hootenanny还可以导入章节标签,甚至是特定语言轨道解析的元数据. 作为MP4文件容器格式的基础, QuickTime能够处理环绕声或多种语言的多个同步音轨. 此外,QuickTime可以在其文件结构中本地处理类似dvd的交互式菜单. 

其他玩家, 比如VLC, 可以处理额外的元数据, 包括定时文本选项,如字幕, 哪些是可以开关的. 其他开源选项包括EasyTAG, 它最初是为向MP3文件添加ID3标签而设计的, 但它也适用于MP4文件, 甚至是许多开源转码应用程序所基于的可靠的FFmpeg.

对于开源元数据工具,要注意一点, 尤其是像FFmpeg这样的流行程序的构建. 这些工作在不同部分的开发人员之间进行分叉或分割, 因此,您的体验可能因FFmpeg的特定版本而异.

事实上, 对最近的开源元数据工具的搜索显示,“FFmpeg的元数据处理处于不断变化之中,最近的一份报告显示 关于Arch Linux的博客文章. “如果有人现在从颠覆中构建一个未打补丁的版本, 在某些情况下,元数据不能正确排列。”.

9. 冲去救援? 围绕MPEG DASH(通过HTTP的MPEG动态自适应流)及其最近的批准的嗡嗡声已经达到了顶峰, 既然最初的标准已经得到批准. 困难的部分还没有到来, 然而, 因为采用通用的文件格式和通用的加密方案将很快被一些符合dash的播放器所采用. 至少这是希望, 因为保证潜在的符合dash的玩家之间的互操作性可能是最大的挑战. 预计高通公司(QUALCOMM Inc .)将推出DASH播放器.,爱立信,甚至微软和Adobe.

在每个DASH播放器编码内容片段后始终播放, 下一步是确保元数据在玩家之间排列一致. 看起来很容易, 几乎是MPEG DASH规范所固有的, 因为DASH只不过是一种一致的基于xml的方式来引用各种同步的MP4片段. 然而,在首批符合dash标准的设备上市后,挑战至少还会持续几个月. 这是transition, Inc .的关键测试领域之一.(我联合创立的提供互操作性测试的咨询公司)将在2012年上半年重点关注.

10. 保持新鲜. 流媒体特约编辑何塞·卡斯蒂略在他的许多电子邮件中都使用了“保持辛辣”的签名. 对于视频元数据,必然的结果是保持它的新鲜感.

换句话说,不要只是标记一个视频,上传它,然后忘记它.

“如果你有一个受欢迎的视频,随着时间的推移,它的浏览量会持续增加, 定期更新你的标签,以利用新的搜索,这篇题为“给合作伙伴的建议”的YouTube博客文章写道, 他指出,“在线搜索行为总是在变化, 所以你的标签应该随之改变.”

考虑在线视频平台的视频元数据的方式与考虑博客文章的方式非常相似:当博客文章是新发布的时候,特定的标签或标签是有吸引力的, 特别是当帖子是及时的时事. 然而,标签有参考或指导的腿, 基于文本的内容可能会在最初的博客文章发布一两个月后有所不同.

长尾视频内容也是如此, 对于没有文字记录或字幕的视频,标签和标签变得更加重要, 因为标签, title, 和描述是目前区分热门视频和不太受欢迎视频的唯一方法.

最后,值得注意的是市场上的一些元数据玩家. 公司包括 Anyclip, Digitalsmiths集团., 思想公平运动, Pictron公司. 提供各种元数据提取套件. 有些是作为产品提供的,而另一些是作为视频发现服务提供的. 此外,还提供基本的元数据提取 Adobe 非线性编辑软件 苹果的 iMovie和Final Cut Pro X. 一些额外的产品, 在“计算机视觉系统”的标题下,,将于2012年上市.

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

元数据的广泛使用即将到来,但“即将”到什么程度??

在线视频行业即将提供由元数据驱动的有用新功能. 但是,这个承诺何时才能成为现实呢?

买家指南:元数据

视频索引和元数据提取服务帮助观众找到他们想看的片段. 这里有一些在购买之前要问的关键问题.

提及的公司及供应商