To ja, Twój asystent głosowy. Oto czym Cię wkrótce zaskoczę.
Asystenci głosowi w zaskakującym tempie zyskują na popularności. Jak wskazują statystyki, w samej Wielkiej Brytanii z inteligentnych rozwiązań głosowych korzystało w ubiegłym roku prawie 10 milionów osób. Technologia małymi krokami zdobywa także zaufanie polskich użytkowników. W ślad za zainteresowaniem konsumentów idą wysiłki firm, które chcą być postrzegane jako innowacyjne. Czym asystenci głosowi zaskoczą nas w najbliższej przyszłości?
Niewątpliwa popularność smart speakers w krajach anglojęzycznych pozwala sądzić, że głosowe interfejsy użytkownika (VUI) odniosą sukces na kolejnych rynkach. Jakie urządzenia podbijają obecnie serca entuzjastów nowych technologii? W Wielkiej Brytanii prym wiedzie Amazon z linią Echo oraz wirtualną asystentką Alexą. Użytkownicy mogą z nią rozmawiać wykorzystując podstawowe, wbudowane funkcjonalności spod znaku voice search lub dodatkowo aktywować tzw. skille, czyli umiejętności przygotowywane przez wyspecjalizowane zespoły programistów. Liczba poszczególnych skilli jest zależna od kraju użytkownika. Najwięcej dostępnych jest, co nie dziwi, na rynku amerykańskim (ponad 56 tysięcy) i w Wielkiej Brytanii (blisko 30 tysięcy).
Podstawowe usługi głosowe uruchomią minutnik w kuchni, odtworzą płytę ulubionego artysty lub podadzą prognozę pogody. A skille? Te można włączyć za pośrednictwem wirtualnego sklepu Alexa Skills Store. Wśród nich znajduje się wiele rozwiązań przygotowywanych przez marki, które opierają wizerunek na innowacyjności. Dla przykładu, jeden z brytyjskich przewoźników kolejowych zaproponował klientom możliwość zakupu biletów za pośrednictwem asystenta Amazona. Za wdrożenie pomysłu odpowiadali polscy programiści.
Rozwiązanie dla każdego
W rozwój głosowych interfejsów użytkownika coraz śmielej inwestuje branża motoryzacyjna. Producenci pojazdów dostrzegli, że frustracja współczesnych kierowców związana z poczuciem marnotrawienia czasu w korkach, tworzy potężną szansę biznesową. Receptą na rozterki tracących cenne minuty zmotoryzowanych ma być asystent głosowy. Dyktowanie korespondencji, rejestracja wizyty u dentysty, rezerwacja stolika w ulubionej restauracji – wszystko natychmiast i to z rękami na kierownicy? Dla samochodów przyszłości to standard.
Technologie głosowe stanowią szansę nie tylko dla dużych koncernów. Własny skill będzie dobrym rozwiązaniem także dla małych graczy, np. w branży e-commerce. Właściciel sklepu internetowego skorzysta z usług Alexy, gdy będzie zabiegał o podniesienie jakości obsługi klienta bez ponoszenia kosztów zatrudnienia kolejnego pracownika. Asystent sprawdzi dostępność towaru, przedstawi metody płatności oraz poinformuje o statusie wysyłki.
Asystenci głosowi równie dobrze spiszą się w relacjach B2B. Już teraz firmy mogą korzystać z usług Alexa for Business oferującej obsługę salek konferencyjnych (zrób notatkę z rozmowy, uruchom rzutnik), bądź ułatwiającej dostęp do służbowego oprogramowania. Amazon dba o to, aby jakość usług dostarczanych na Alexę była jak najwyższa. Dlatego wprowadził system certyfikujący deweloperów, którzy potrafią budować wspomniane skille. Oficjalnym dostawcą rozwiązań dla Alexy jest m.in. firma intive – globalny partner transformacji cyfrowej dla AUDI, Credit Suisse czy Rossmanna, obecny w ośmiu lokalizacjach w Polsce.
Wyzwania dla użytkowników i programistów
Czy szerokie zastosowanie VUI sprawia, że ich przyszłość rysuje się w jasnych barwach? Okazuje się, że technologii mogą nie zaakceptować… sami użytkownicy. Jak pokazują badania, 30 proc. młodych internautów deklaruje, że chciałoby korzystać z asystenta w przestrzeni publicznej, ale czuje przy tym pewne skrępowanie. Osoba oczekująca na autobus nie zapyta swojego telefonu o repertuar kina, obawiając się krzywych spojrzeń przechodniów. Podobna bariera istnieje także w warunkach domowych, w odniesieniu do członków rodziny. Większość ludzi odczuwa pewien dyskomfort mówiąc do urządzenia, szczególnie w obecności obserwatora.
Z punktu widzenia programisty klucz do sukcesu rozwiązań głosowych tkwi w „intent recognition”, czyli takim zaprojektowaniu skilla, aby wiedział, co użytkownik ma na myśli. Asystent powinien nadążać za różnorodnością żywego języka, który podlega nieustannej ewolucji i występuje w wielu, kulturowo uwarunkowanych, wariantach. Inaczej będą wysławiać się młodzi, a inaczej starsi użytkownicy. Inaczej komunikują się mieszkańcy poszczególnych regionów, grup społecznych lub zawodowych. Każda z nich będzie używała charakterystycznego, niespotykanego w innych kręgach żargonu. – Młody człowiek nie ma cierpliwości do prowadzenia długich rozmów z asystentem głosowym. Zależy mu na wypowiedzeniu krótkiego komunikatu i oczekuje, że Alexa zrozumie go w mig. Dobrze napisany skill powinien błyskawicznie rozpoznać intencję użytkownika. W przeciwnym razie zostanie szybko odinstalowany – tłumaczy Marcin Niczyporuk, Director of Cognitive Service Line w intive.
Lingwiści projektują dialogi
Zespoły deweloperskie proces tworzenia skilli zaczynają od postawienia pytania: w jaki sposób moja usługa przyda się użytkownikom? Uzyskana odpowiedź jest zależna od zdefiniowania potrzeb potencjalnego rozmówcy oraz doświadczenia, jakie będzie mu towarzyszyć w rozmowie z botem. Co ciekawe, nad interfejsem urządzeń głosowych pracują nie tylko wyspecjalizowani UX designerzy, ale również lingwiści i kulturoznawcy. Ich rola polega na dookreśleniu założeń osobowościowych asystenta – a dzięki temu – zaprojektowaniu wiarygodnych dialogów. Tworzonych jest około 50-100 wersji tego samego pytania, aby bot nie miał problemu z rozpoznaniem, co użytkownik ma na myśli.
Zdefiniowanie dialogów jest ściśle skorelowane z przeznaczeniem danego skill’a. Komunikacja prostego interfejsu głosowego stworzonego do informowania o ofercie operatora komórkowego będzie się różnić od komunikacji bazowego voice search’a, który zapisze notatkę, powie jakiej pogody należy spodziewać się następnego dnia i opowie dowcip.
Programuj i testuj
Napisanie prostej, działającej w chmurze, aplikacji dla Alexy nie musi być czasochłonnym procesem. Znacznie większym wyzwaniem może okazać się etap końcowy, czyli testowanie. Co prawda istnieją sposoby na automatyzację tego procesu, ale nie jest to rozwiązanie idealne – najlepiej ciągle sprawdzają się wielogodzinne konwersacje testera z botem. W fazie produkcji to jedno z najtrudniejszych, a przy tym najważniejszych zadań.
Gotowy, przetestowany program trafia do Alexa Skills Store, gdzie przechodzi końcową weryfikację, tym razem przeprowadzaną przez pracowników Amazona. Aplikacje nie spełniające wymagań amerykańskiego koncernu nie zostają dopuszczane do dystrybucji w sklepie. Akceptacja projektu w dużej mierze zależy od wiedzy i umiejętności zespołów deweloperskich, a biegłych w tej sztuce wciąż jest niewielu.
Co przyniesie przyszłość?
Obecnie wszystkie skille dostępne w wirtualnym sklepie Amazona oferowane są bezpłatnie. Ponoszone opłaty mogą dotyczyć jedynie oferowanych w ramach nich usług, np. zakupu biletów. W najbliższej perspektywie należy jednak spodziewać się zmiany modelu biznesowego i wypracowania metod monetyzacji rosnącej popularności interfejsów głosowych. Obecnie, Alexa proponuje In-Skill purchase – opcję zakupienia zawartości premium, od której Amazon pobiera 30 procent ceny ustalonej przez twórcę skilla.
Technologia nadąża za zmieniającymi się oczekiwaniami użytkowników. W odpowiedzi na wymagania rozmówców, boty będą się uczyć i stale podnosić swoje umiejętności. Dla specjalistów pracujących nad rozwojem oprogramowania na Alexę oznacza to projektowanie nowych dialogów nawet po zakończeniu zasadniczej fazy produkcji.
Coraz inteligentniejsza staje się sama Alexa. Wirtualna asystentka Amazona wciąż zyskuje nowe funkcjonalności i potrafi dziś pomóc w zdalnej realizacji mnóstwa zadań. Konkurencja nie pozostaje w tyle. Pomysłów na wykorzystanie interfejsu głosowego pojawi się więcej, bo rozwiązanie można stosować w niemal każdej gałęzi biznesu. Przyszłość to dziś.