本次内容来自DEMUXED,演讲者是Simon Says的首席技术官Roderick Hodgson Roderick 向我们介绍了一种工具:simon says组件,以及其中的一些技术挑战。
simon says可以利用人工智能提供音视频的转录、字幕以及翻译功能。
转录在后期制作过程中被广泛使用,simon says利用语音识别来提供基于时间码和基于帧的转录,几乎每个单词都有一个进出时间戳和帧的序号。除此之外,还提供一些AI驱动的编辑工具,例如演讲者标签等,可以在WebAPP中直接使用。
但往往用户的需求远不止这些,据统计,有大量用户需要找到视频中关键的片段,对它们进行提取和重新排序,以形成他们自己的故事。这是一个很复杂的工作,而simon says致力于使视频编辑像文本编辑一样简单,且是基于网页的。
视频编辑任务应该允许用户在任意位置插入视频流,调整大小并实时查看编辑效果。基于网页浏览器实现这种任意片段的播放以及时间调整是一个挑战。
simon says的解决方式是用媒体片段URI每一个视频片段创建一个HTML元素。预先导入特定时间的片段,指定开始和结束节点,并且可以进行回调。
最后Roderick向我们演示了simon says的使用。
附上演讲视频: