-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

微软的Andy Beach谈论机器学习和媒体

蒂姆Siglin: 欢迎回到流媒体西部2017. 我和我的好朋友安迪·比奇在一起. 告诉我你最近在忙什么?

安迪海滩: 我仍然在微软工作,我真正感兴趣的一个领域是我们如何探索机器学习和媒体, 这就是我今年在流媒体大会上要讲的内容, 来讨论一些不同的选择.

蒂姆Siglin: 事实上是这样的, 我请来了IBM云视频公司的Scott Grizzle, 和, 当然, 他们用沃森做了很多尝试做机器学习, 深度学习, 诸如此类的事情. 重点是通过云计算和大数据的结合来实现这一目标,还是如何实现?

安迪海滩: 我们采取的方法是让机器学习对任何需要它的人来说都是可用的. 如果你是一个数据科学家,你知道R, 有很多方法可以训练你自己的模型, 但如果你只是一名开发人员,你也有办法加入机器学习, 我们有特定的API从某种训练模型中执行一个函数你可以实现那个API来得到你想要的东西, 无论是面部识别还是字幕转录, 或者类似的东西.

蒂姆Siglin: 所以在这些情况下,你正在做语音到文本和计算机视觉作为机器学习的一部分?

安迪海滩: 完全, 然后, 如果你不是开发人员, 但你仍然想要获得这类信息, 然后我们甚至将其产品化, 作为你的媒体服务, 吸收这些元素的能力, 上传你的内容,并回馈和互动播放器,其中有面部识别小部件, 或者是播放器播放时播放的所有音频的完整文本, 并且允许你在飞行中把它翻译成其他语言.

蒂姆Siglin: 最让我着迷的是我曾经做过一些我们称之为索引,搜索和检索的工作和一些在独立设备上做这些事情的公司合作过, 从本质上讲,现在你所做的就是利用云的力量, 还有你通过分析得到的分布式大数据表. 人们是否有办法对音频记录显示的内容进行正确评分, 因为我们都知道他们并不完美?

安迪海滩: 所有出来的东西都有某种能力得分, 随着时间的推移,我们有能力调整它,并确认它的正确性, 或者你可以在你的内容中编辑需要修改的东西,它会适应并从这些修改中学习.

蒂姆Siglin: 有趣的. 你的目标是一个特定的垂直市场吗? 当我在欧洲通过框架包六项目工作时,有一群来自豪斯比的Lurn的人自然地说. 他们可以很好地区分法律和医学,因为这两个术语非常不同, but generic or general conversation was much more difficult; so how are you guys approaching that?

安迪海滩: 当你谈论它的认知服务部分时,它只是一种基线API,它只是试图在上下文中理解它所看到的单词, 基于它周围的词语. So, 我们试着去理解某件事与这段话的关系或者其他的东西, 和 that helps frankly a lot with the accuracy; because it's gonna underst和 the difference between certain terminology that might get used because it's putting it into a context.

蒂姆Siglin: 你们是否有特定的图书馆或垂直市场? 比如法律,比如医疗?

安迪海滩: 你知道的,它非常开放. 我认为企业应用、监控和教育领域都在使用它. 但, 我们有娱乐合作伙伴,他们今天也在使用相同的服务来创建功能.

蒂姆Siglin: 好的,漂亮的. 你还在做什么? 显然机器学习不是你唯一在做的事情.

安迪海滩: 在过去的几个月里,我终于做了一些大型的视频项目, which were the first sort of transcoding projects that I've worked on in years 和 it was like working on old muscle memory; pulling back terminology 和 things. 所以这是一件令人兴奋的事情, 但是与此相关, 从基础设施的角度来看,我发现的另一个重要的领域是,我正在围绕大规模数据做更多的工作. 我们通过机器学习或视频播放器互动等方式获得的所有数据点, 你如何把它放在某个地方,然后非常迅速地切片,以揭示你所看到的某些趋势. 我必须学习更多关于容器如何适应这种情况以及如何创建大型数据库的知识. 这些都是我从未想过我会与之合作的东西——我在一天结束的时候是一个视频主持人. 但现在我正在学习所有这些新元素,这有点令人兴奋.

蒂姆Siglin: 我们都知道元数据是什么 ... 你说的是段落中单词的语境, 围绕容器和格式的元数据本身可以帮助您约束到特定的决策点. 如果它是MPEG-2传输流, more than likely it's gonna only have one or two codecs in there; versus if it's something that's WebM, 它可能不会将AVC作为格式的一部分. 一如既往,感谢您的到来和来访,祝节目愉快.

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

视频:机器学习将如何影响媒体供应链?

谷歌的Leonidas Kantothanassis在他的内容交付峰会主题演讲中探讨了机器学习在媒体工作流程和供应变化中的广泛应用.

SMW 17: VideoRx的Robert Reinhardt谈SRT和编解码器的未来

流媒体的蒂姆·西格林在2017年流媒体西部采访了VideoRx的罗伯特·莱因哈特.

SMW 17: IBM的Scott Grizzle谈论沃森和视频浓缩

流媒体的蒂姆·西格林在2017年流媒体西部大会上采访了IBM云视频高级解决方案工程师斯科特·格里泽.

提及的公司及供应商