À medida que os serviços de voz, como a Amazon Alexa, ganham popularidade, os consumidores estão utilizando VUIs (voice user interfaces) para jogar, receber as últimas notícias e controlar um crescente número de dispositivos domésticos inteligentes.
As VUIs são naturais, conversacionais e centradas no usuário.
Uma ótima experiência de voz permite que usuários expressem suas intenções de diversas maneiras. Ela deve ser rica e flexível. Por isso, desenvolver para voz não é o mesmo que criar interfaces de usuário gráficas (GUIs) para a Web ou dispositivos móveis.
Quanto mais fácil for usar uma skill, mais velocidade e eficiência ela oferecerá.
As skills de Alexa trazem velocidade e eficiência para tarefas mundanas ou habituais - e é por isso que a voz está preparada para se tornar onipresente.
Considere o cronômetro da cozinha. Com a Alexa, definir um timer é tão fácil quanto dizer “Alexa, coloque um timer por 10 minutos”. Quem teria imaginado que apertar alguns botões no microondas se tornaria a opção menos conveniente?
Ganhe dinheiro vendendo conteúdo digital em sua skill. Você pode vender conteúdo relevante aos seus clientes através de assinaturas, compras únicas ou recorrentes.
Por exemplo, digamos que você construa uma skill de compartilhamento de conhecimento que ajude a ensinar ao usuário um processo ou tarefa. Você pode começar com conteúdo introdutório gratuito para ganhar a confiança do usuário de que a skill é valiosa. Depois, você pode vender acesso ao conteúdo premium mais sofisticado e valioso.
Com o ASK (Alexa Skills Kit), você pode criar diferentes tipos de skills. O ASK oferece quatro modelos de interação pré-construídos que você pode aproveitar, ou você pode criar uma skill totalmente personalizada. Os modelos de interação pré-construídos incluem solicitações e enunciados pré-definidos para ajudá-lo a começar a construir rapidamente. Você pode personalizá-los ao seu gosto.
Use a API para skills de Smart Home para criar uma skill de casa inteligente com um modelo pré-construído. Esse tipo de skill controla dispositivos domésticos inteligentes, como câmeras, luzes, travas, termostatos e smart TVs. A Smart Home Skill API oferece menos controle sobre a experiência do usuário, mas simplifica o desenvolvimento, pois você não precisa criar a VUI por conta própria.
Invocar a skill também é muito fácil. Um usuário pode fazer solicitações como as seguintes:
"Alexa, ligue as luzes da sala"
"Alexa, aumente a temperatura em dois graus”
"Alexa, mostre a câmera da porta da frente”
Use a API para skills de Flash Briefing para fornecer aos seus clientes notícias e outros conteúdos curtos. Um usuário pode fazer solicitações como as seguintes:
"Alexa, dê meu flash briefing”
"Alexa, conte-me as últimas notícias”
Como desenvolvedor de skills, você define os feeds de conteúdo para o flash briefing solicitado. Esses feeds podem conter conteúdo de áudio reproduzido para o usuário ou conteúdo de texto lido para o usuário.
Use a API para skills de Vídeo para fornecer conteúdo de vídeo, como programas de TV e filmes, para os usuários. Um usuário pode fazer solicitações como as seguintes:
"Alexa, jogue Manchester by the Sea”
"Alexa, mude a TV para o canal 4”
Como desenvolvedor de skills, você define as solicitações que a skill pode manipular, tais como pesquisar e reproduzir conteúdo de vídeo, ou como os resultados da pesquisa de conteúdo de vídeo são exibidos em dispositivos habilitados para Alexa.
Use a API de skills de música para fornecer conteúdo de áudio, como músicas, listas de reprodução ou estações de rádio para os usuários. Um usuário pode fazer solicitações como as seguintes:
"Alexa, toca música"
"Alexa, tocar jazz"
Essa API processa as palavras que um usuário pode utilizar para solicitar e controlar um conteúdo de áudio. Essas palavras faladas se transformam em solicitações que são enviadas para sua skill. Sua skill processa essas solicitações e responde apropriadamente, enviando de volta o conteúdo de áudio para o usuário em um dispositivo habilitado para Alexa.
Nota: Atualmente, as skills de música estão disponíveis apenas nos Estados Unidos.
Estes são apenas alguns exemplos de skills pré-construídas que podem ajudar a acelerar o seu desenvolvimento.
Aqui estão alguns exemplos de como um usuário pode interagir com uma skill personalizada:
Com uma skill personalizada, você pode envolver o usuário em um jogo, como palavras cruzadas ou trivialidades, ou simplesmente criar qualquer outra ação que desejar!
Como desenvolvedor de skills, você:
Ao longo deste curso, você aprenderá como desenvolver uma skill personalizada usando o ASK.
A seguir, veja um fluxo simples que demonstra como a Alexa funciona. Neste exemplo, o usuário invoca uma skill simples da Alexa chamada Hello World.
1. Para iniciar a skill, o usuário diz: "Alexa, abra Hello World."
2. O dispositivo habilitado para Alexa envia o enunciado para o serviço Alexa na nuvem. Lá, o enunciado é processado através de reconhecimento automático de fala, para conversão em texto e compreensão de linguagem natural para reconhecer a intenção do texto.
3. A Alexa envia uma solicitação JavaScript Object Notation (JSON) para processar a intenção de uma função do AWS Lambda na nuvem. A função Lambda age em um back-end e executa o código para processar a intenção. Nesse caso, a função Lambda retorna "Bem-vindo à skill Hello World".
A animação abaixo demonstra o que acontece quando um usuário interage com uma skill de Alexa. Ela pressupõe que você esteja usando o AWS Lambda, computação em nuvem sem servidor, para hospedar o código da sua skill.
Siga estas etapas para desenvolver sua skill com o ASK.
Comece projetando o modelo de interação de voz de sua skill. Depois de começar a projetar, você entenderá rapidamente que projetar para voz é diferente do que projetar para aplicativos móveis ou baseados na web.
Você precisa pensar em todas as maneiras diferentes nas quais um usuário pode interagir com sua skill de voz. Para fornecer uma experiência de voz fluida e natural, é importante criar scripts e, em seguida, representar as diferentes maneiras que um usuário pode falar com a Alexa.
Além disso, se você tiver uma experiência multimodal (voz e visual), precisará pensar em diferentes fluxos de navegação para sua skill.
Quando seu modelo de interação estiver pronto, crie os enunciados, intenções e slots (variáveis) no Console do Portal dos Desenvolvedores de Alexa.
O modelo de interação é salvo no formato JSON e você pode editar o modelo com qualquer ferramenta de edição. Depois que seu modelo de interação JSON estiver pronto, crie a função de back-end Lambda no AWS Management Console.
Selecione a linguagem de programação de sua escolha e o kit de desenvolvimento de software ASK (SDK) correspondente e comece a codificar sua skill. O Lambda suporta as linguagens de programação Java, Go, PowerShell, Node.js, C #, Python e Ruby.
Você pode criar e hospedar a maioria das skills gratuitamente com o AWS Lambda, que é gratuito para o primeiro milhão de chamadas por mês. Quando a função backend do Lambda estiver pronta, integre a função do Lambda à sua skill e teste-a no console do desenvolvedor de Alexa.
O console do desenvolvedor da AWS possui um simulador de Alexa integrado, que é semelhante ao teste em um dispositivo habilitado para Alexa real.
Depois de testar sua skill com o simulador de Alexa, recomendamos que você colete feedback do usuário para resolver problemas e fazer melhorias antes de enviar sua skill para certificação.
Estas são as etapas fundamentais para desenvolver uma skill de Alexa
Você mergulhará mais fundo em cada etapa nos módulos subseqüentes deste curso.
A seguir estão os requisitos para começar a desenvolver uma Alexa Skill: