Alexa Champion Ralf Eggert: „Die Entwicklung von Skills mit der Alexa Presentation Language ist ein Riesenschritt nach vorne“

Kristin Fritsche May 04, 2019
Share:
German Multimodal
Blog_Header_Post_Img

In immer mehr Haushalten steht nicht nur das bekannte und beliebte Amazon Echo, sondern mit dem Echo Show oder dem Echo Spot auch ein Gerät, dass zusätzlich über einen Touchscreen verfügt – für Entwickler eine interessante Möglichkeit ihre Alexa Skills für den Bildschirm zu optimieren. Alexa Champion Ralf Eggert spricht in diesem Blogartikel über die Vorteile eines multimodalen Skills und gibt Tipps, wie man am besten mit der APL-Skill-Entwicklung startet. „Die Sprache ist natürlich auch bei multimodalen Skills immer noch das Hauptmedium, es gilt immer ‚Voice first‘. Trotzdem habe ich zum Beispiel in meiner Familie beobachtet, dass meine Töchter lieber den Echo Show nutzen als den Echo, der nur per Stimme antwortet - und sei es nur für Musiksteuerung,“ erzählt Ralf, Alexa Champion und Geschäftsführer der Agentur Travello, die sich auf die Entwicklung von Alexa-Skills spezialisiert hat.

Ralf optimiert mittlerweile alle seiner Skills für die Echo-Geräte mit Bildschirm. APL ermöglicht die Entwicklung von multimodalen Skills, die Sprache, Touch, Text, Bilder, Grafiken und Video enthalten, in einer einzigen Oberfläche – aus Ralf´s Sicht ein Riesenschritt: „Vor APL war das Entwickeln von multimodalen Skills komplizierter und man hatte wenig Möglichkeiten auf das Erscheinungsbild des Skills auf dem Gerät Einfluss zu nehmen. Mit APL kann man fast alles umsetzen.“

Skills interaktiver gestalten

Aktuell arbeitet das Team von Travello an Tina, einem Alexa Skill für touristische Infos. Bei Hotels und Fremdenverkehrsämtern gibt es immer wieder Fragen, die stetig wiederholt werden. Der Skill beantwortet Fragen wie „Wann gibt es Frühstück?“ oder „Wo sind hier Sehenswürdigkeiten?“. Das Team von Travello nutzt auch für die Entwicklung dieses Use Case APL. „Wir können jetzt visuell viel mehr machen und zum Beispiel kleine Videosequenzen abspielen. So können wir das ganze viel interaktiver gestalten als mit der reinen Ausgabe von Sprache. Gerade weil per Sprache nicht so viele Informationen unterbringen kann, ist das unterstützende Display schon sehr spannend,“ so Ralf. Mit APL ist es zum Beispiel möglich Diashows abzuspielen oder gesprochenen Text mitlaufen zu lassen.

Trotz des Bildschirms, muss man den Grundsatz „Voice-first“ im Gedächtnis behalten: „Niemand sitzt permanent vor dem Echo Show-Bildschirm. Alles was wir dort anzeigen, muss auch per Sprache unterstützt werden. Der Bildschirm dient nur als Erweiterung des Spracherlebnisses, er ersetzt dieses nicht.“

Verbessertes Testen

Nicht nur die interaktiven Möglichkeiten werden durch APL deutlich erweitert, das Entwickeln selbst wird deutlich komfortabler: „Vor APL war es schwierig zu wissen, wie die Skills auf dem Gerät dann wirklich aussehen. Wenn man jetzt in seinem Template mit APL arbeitet, kann man das Ergebnis sofort auf dem Device sehen.“ beschreibt er. „Außerdem entwickelt man den Skill nur einmal und für verschiedene Geräte und sieht sofort, wie er dargestellt wird. Beispielsweise sieht ein Skill auf dem Echo Spot anders aus, da er eine andere Displaygröße hat. Mir spart das viel Zeit, denn ich habe die Darstellung des Skills immer vor Augen, unabhängig vom Endgerät,“ findet Ralf.

Einstieg mit bekannten Templates

Für Entwickler bedeutet eine neue Sprache wie die Alexa Presentation Language auch immer eine gewisse Einstiegshürde. Für Ralf lohnte es sich aber schnell, sich mit damit zu beschäftigen. „Natürlich muss ich mich erst einarbeiten, aber wenn man das gemeistert hat, macht es viel Spaß,“ erzählt er. Mit APL werden die Templates in JSON, dem schon bekannten JavaScript-Format, definiert. Das wird von einer APL-Engine eingelesen, die dadurch die Information erhält, wie der Code dargestellt werden soll. „Es ist vergleichbar mit HTML, nur gibt es eben bestimmte Befehle und Szenarien. Es ist nicht so, dass man wirklich programmiert, muss sich aber natürlich an gewisse Regeln halten“, erklärt Ralf.

Ralf empfiehlt, sich beim Umstieg auf APL erst einmal an den Templates orientieren. Bei ihm wurde dann schnell der Erfindergeist geweckt. „Man fängt an neue Dinge zu implementieren. Wenn man erstmal die erste Slideshow erfolgreich integriert hat, dann macht das natürlich Lust weiterzumachen“, erzählt der Entwickler. Eine große Hilfe stellt aus seiner Erfahrung die umfangreiche Dokumentation dar. Fragen werden zudem schnell und unkompliziert im Forum beantwortet.

Ein Tipp, der den Umstieg erleichtern kann: Regelmäßiges Speichern im Authoring Tool. „Die Änderungen muss man selbst speichern. Das erfordert anfangs etwas Umgewöhnung. Das Positive: Man wird dadurch gezwungen die Dateien sauber abzulegen“, so Ralf. 

Fazit: Es lohnt sich

Derzeit ist APL noch in der Public Beta Phase und kann von Entwicklern ausprobiert werden: „Es lohnt sich auf jeden Fall für jeden Skill-Entwickler sich mit APL zu beschäftigen“, findet Ralf.

Auch wer noch kein konkretes Projekt auf dem Tisch hat, kann zum Beispiel damit starten seine bestehenden Skills mit APL zu aktualisieren. „In der Developer-Konsole von Alexa gibt es einen Interface-Reiter wo man die Alexa Presentation Language neben der bisherigen Display Language aktivieren muss. Neue Skills entwickeln wir künftig gleich für APL. Die Entwicklung mit APL im Vergleich zu den alten Templates ist schon ein Riesenschritt nach vorne,“ findet Ralf.

Ressourcen: