开发者控制台

Echo Show的视频技能工具包(VSK)

Echo Show的视频技能工具包(VSK)

Echo Show设备能够为用户提供通过语音或触摸屏幕实现的交互体验。专为Echo Show设计的视频技能可以将视频内容与语音交互相结合(多模式)。Echo Show是一款无需安装应用的设备。采用视频技能工具包(VSK)交付视频内容,让Echo Show用户能够通过触摸或语音命令对视频进行控制。

Echo Show设备

Echo Show是一款“始终开启”且无需安装应用的设备,利用了基于云的技能和通用的设备端组件。

在Echo Show上使用视频技能的常见场景可能包括这样一幕:用户一边在厨房里做饭,一边对她的设备说“Alexa,播放《博斯》”。

多模式设备的示例使用场景
Echo Show的VSK的示例使用场景

亚马逊提供了以下Echo Show设备:

Echo Show(第2代)于2018年10月上市,配备10.1英寸高清屏幕。Echo Show 5于2019年6月上市,配备比较小巧的5.5英寸屏幕。Echo Show 8于2019年11月上市,配备8.0英寸屏幕。目前,Echo Spot暂不支持VSK集成。

视频技能工具包(VSK)

视频技能工具包(VSK)是一组API,让用户能够使用Alexa来与视频内容进行交互。VSK提供了一种开发视频技能的方法,无需设计新的机制来实现用户与视频内容的交互。传统的自定义技能开发需要设计措辞和控制流程,而VSK提供了一系列专门的工具来支持Echo Show和Fire TV上的视频控制机制。

VSK可实现多种功能,例如:

  • 播放控制
  • 目录搜索
  • 频道冲浪

视频技能与自定义技能在屏幕显示方面的比较

Video Skill API适用于视频提供方,也适用于正设法让其设备支持语音交互的设备制造商。实现涉及Alexa指令的处理,例如使用AWS Lambda和您自己的视频内容来实现“Alexa,播放《星际穿越》”。

相比之下,要支持Alexa技能中的视觉效果(图像、短视频片段、纯文本等),则应使用Alexa Presentation Language(APL),通过显示模板来创建自定义技能(而不是视频技能)。例如,您可能想要在Echo Show屏幕上显示与小测验技能相关的文本或图像,而不是利用Video Skill API在视频内容中提供更复杂的交互式语音体验。在这种情况下,请参阅为带有屏幕且支持Alexa的设备创建技能

在Echo Show上交付视频内容

视频技能需要使用(AWS Lambda)和网页应用播放器。对Lambda的要求受Alexa技能架构推动,而Echo Show架构上的VSK则推动了对无应用网络播放器的要求。以下是它的大体工作方式:

  • 客户通过账户关联(例如使用OAuth)使用您的视频技能进行身份验证。
  • Echo Show上的VSK提供了用于显示“搜索”和“浏览”等功能的模板。设备使用您的视频内容对这些模板进行渲染。
  • 使用您拥有的自定义网络播放器进行播放。

目录集成

目录集成是根据XML架构(即目录数据格式(CDF))描述您的媒体,并定期按照目录文档中的过程将目录上传到S3存储桶的过程。

目录集成目前仅限于长篇电影和剧集式电视节目,因此,如果需要有关这个问题的指导,请联系您的亚马逊业务联系人。您必须有资格进行目录集成,才能完全实现Echo Show的VSK。如果尚未集成您的目录,请先执行目录集成步骤,然后再设计您自己的Echo Show设备视频技能。

开始构建Echo Show的视频技能

要安装、构建和部署面向Echo Show设备的参考视频技能,您需要具备以下条件:

  • 一台用于测试的Echo Show设备
  • Alexa开发者账户
  • AWS开发者账户
  • AWS Lambda - 由参考视频技能提供
  • 针对设备进行了优化的网络播放器 - 由参考视频技能提供
  • 账户关联 - 用于观看您的内容
  • 集成目录的媒体和目录名称

此外,要创建自己的视频技能,您还需要标志图片和背景图片。

为了快速上手,强烈建议先使用自动化基础架构CLI工具来安装、构建和部署参考视频技能。此工具可以使用电脑的终端或PowerShell来加快视频技能设置过程。参考视频技能还为您提供了网络播放器,以及一个目录的访问权限,用于在设备上进行测试。

您可能还想实现其他后端服务,例如内容元数据检索、类别查找和多种形式的搜索。

另请注意,即使之前已在Fire TV应用中创建了视频技能和VSK的Lambda函数,也必须在为Echo Show设备上的VSK单独创建新的视频技能,并单独创建新的Lambda函数。

大体工作流程

要集成Echo Show的VSK,首先要在Alexa开发者控制台中创建视频技能,然后将其与AWS上的Lambda函数相关联。当用户通过语音与您的技能交互时,Alexa语音服务(AVS)将用户发出的命令转换为JSON对象,称为指令。

Alexa将这些指令发送至您的Lambda函数。您的Lambda函数处理请求,通常还会与您的后端服务进行交互,以检索所需的信息(通过执行查找、查询等)。这些信息可能是所请求内容的URI,也可能是与请求匹配的可用标题。Lambda会检索这些信息并将其发送回Alexa。

后续步骤

查看Echo Show的VSK功能


Last updated: 2021年3月5日