Welke effecten kan het hebben als we bepaalde (alledaagse) UI zouden vervangen met spraakgestuurde UI?

Inleiding

Spraakgestuurde technologie is de laatste jaren flink in opkomst. Deze technologie houdt in dat je via je stem (spraak) een apparaat kan besturen. Dit komt vooral doordat deze technologie hand in hand gaat met het concept IOT (Internet of things) dat momenteel ook flink in opmars is omdat hier veel vraag naar is.

Google Home, en de Amazon Alexa zijn mooie voorbeelden van nieuwe ontwikkelingen op het gebied van spraakgestuurde technologie. Dit zijn apparaten die je in je huis neer kan zetten en van alles kan vragen. Ze zijn verbonden met het internet en hebben antwoord op al je vragen en kunnen zelfs simpele taken voor je uitvoeren.

Het is wel leuk om te zien welk beeld men vroeger had van spraakgestuurde technologie en waar het nu naar toe gaat. Kijk maar naar de meeste sci-fi films waar ze in ruimteschepen tegen de computers praten om bepaalde functies uit te voeren. Zulke dingen zijn bijvoorbeeld al mogelijk met de Google Home tot bepaalde hoogte. Ook heb je de serie van ‘Nightrider’ waar de bestuurder van de auto tegen zijn auto kan praten. In deze serie zit er alleen ook een intelligentie (AI) aan gekoppeld, waardoor de auto een eigen leven heeft. Dit laatste is momenteel nog niet echt aanwezig is in huidige spraakgestuurde systemen. De technologie is al wel even aanwezig in auto’s en was misschien wel een van de eerste en meest logische toepassingen.

Een van de laatste trends op dit gebied zijn de marketingcampagnes die gebruik maken van het feit dat mensen toegang hebben tot spraakgestuurde software zoals hun Android telefoons en de Google Home. We zagen het een beetje met de Google Home reclames tijdens de Super Bowl in Amerika, waarbij er een aantal “Ok Google…” commando’s werden gedemonstreerd. Het probleem was dat bij iedereen die al een Google Home in bezit had, deze op die commando’s reageerde. Dit was volgens Google niet de bedoeling. Burger King daarentegen, had een reclame voor hun Whopper uitgezonden waarin ze met opzet gebruik maakte van het commando “Ok Google what is a Whopper?”. Hier reageerde alle Android telefoons en Google Home’s met het oplezen van de Wikipedia pagina over de Whopper. Google was daar niet zo blij mee omdat een hoop mensen hier niet zo blij mee waren, dus hebben ze dit commando tijdelijk uitgeschakeld voor alle devices.

De vraag is nu dus, zouden we alledaagse UI kunnen vervangen met spraakgestuurde UI? Bij alledaagse UI kun je bijvoorbeeld denken aan automaten in openbare ruimtes zoals bankautomaten, automaten waar je je ov-chipkaart kan opladen, thuis je IOT (smart home) apparaten, of misschien gewoon je computer of televisie.

Het gemak van de mens rondom spraakgestuurde technologie

Het eerste probleem dat komt kijken bij deze vraag, is het gemak van de mens rondom deze technologie. Mensen zijn niet gewend te praten tegen een levenloos object. Het komt een beetje hetzelfde neer op het principe als van een hond. Daar praat je in het begin ook niet tegen omdat de meeste mensen dat raar vinden, maar uiteindelijk doe je het toch vanzelf. Vooral omdat een hond hier positief op reageert en je de band versterkt. Google heeft zelf voor hun “Google Assistant” (de spraakgestuurde software op de Google Home en Android) onderzoek gedaan naar het houden van gesprekken met een mens. Ze hebben in dit onderzoek gekeken naar hoe natuurlijke en menselijke gesprekken invloed hebben op gemak bij het gebruik van de Google Assistant. Er worden een paar belangrijke principes genoemd zoals, “Turn Talking” dat mensen altijd om de beurt praten, “Threading” de manier waarop een gesprek ontwikkelt, “efficiency of speech”. Er moet rekening gehouden worden met dat mensen vaak afkortingen gebruiken omdat we al snel weten waar we het over hebben hier moet dus op in gespeeld worden met de software, en tot slot “variable user behavior” mensen gebruiken vaak meerdere termen voor dezelfde betekenis.

Hier moet dus allemaal rekening mee gehouden worden bij het genereren van een gesprek met de gebruiker via spraakgestuurde technologie. Dit zorgt er voor een natuurlijk en comfortabel gesprek tussen de mens en de machine (Cohen, M. H., Giangola, J. P., & Balogh, J., 2004).

Voordeel spraakgestuurde UI bij mensen met een handicap

Een groot voordeel van spraakgestuurde UI is het gebruikersgemak. Het enige wat men nodig heeft bij de interactie met spraakgestuurde UI is zijn/haar spraak. Dit kan vooral voordelig uitpakken bij mensen met een handicap waarbij ze bijvoorbeeld niet met hun handen kunnen werken. Hierdoor zou werken met een computer erg lastig gaan dus zou spraakgestuurde UI goed van pas komen. Ook zou de verbinding tussen spraakgestuurde UI en IOT een goede combinatie kunnen vormen voor mensen met een handicap. Hiermee zouden ze bepaalde acties in het huis kunnen besturen met hun stem, zoals bijvoorbeeld de lichten aan en uit zetten, de verwarming instellen, muziek/tv/telefoon bedienen en nog veel meer. Door de snelle ontwikkeling op dit gebied in de afgelopen tijd, zal er in de toekomst nog veel meer toe te voegen zijn aan dit lijstje (Su, M., & Chung, M., 2001. p225–230)(Dogru, N., 2017. p103–107). Een goed voorbeeld zou de spraak/gesture/EMG (spierbeweging sensor) gestuurde rolstoel waar ideeën voor zijn (Moon, I., Lee, M., Ryu, J., & Mun, M. 2003), voor zwaar gehandicapte mensen (die nog wel in staat zijn te kunnen praten). Het enige nadeel is dat de spraakgestuurde technologie niet voor iedere handicap geschikt is. Bijvoorbeeld dove, en verstandelijk gehandicapte mensen hebben hier niet heel veel aan. Blinde mensen en mensen met lichamelijke beperkingen juist weer wel.

Speelt leeftijd een rol bij deze technologie?

Je zou zeggen dat leeftijd vaak een grote rol speelt bij het beheersen van technologie. Vooral oudere mensen hebben vaak moeite met het begrijpen en gebruiken van nieuwe technologieën. Bij spraakgestuurde technologie ligt dit iets anders. Omdat iedereen weet hoe ze moeten communiceren en praten valt dit makkelijker te begrijpen en gebruiken. Ook is er meer ruimte voor variatie bij het gebruik van deze technologie. Zoals eerder al benoemd, bestaat conversatie uit meerdere termen om iets duidelijk te maken. spraakgestuurde technologie is daarop gebaseerd waardoor het makkelijker is voor iedereen om te gebruiken, omdat je jezelf niet hoeft aan te passen op de technologie maar de technologie zich aanpast op jou. Hierdoor is het alleen even wennen aan het feit dat je tegen een object moet praten maar zodra je dit begrijpt is het best een prettige ervaring. Vooral ouderen zijn hier gevoeliger voor omdat ze persoonlijk contact waarderen. Ouderen kunnen ook snel eenzaam zijn dus vinden ze het een prettig idee om te kunnen praten met hun apparatuur (tv, radio, computer etc.) in plaats van alles met computers te bedienen waar ze weinig van snappen. Aangezien mensen tegenwoordig opgroeien met technologie kan dit in de toekomst wel anders zijn, maar voor de huidige generatie ouderen is dit zeker van toepassing.

Privacy/veiligheid kwesties

Wanneer je spraakgestuurde technologie in het openbaar gaat implementeren voor alledaagse handelingen komt er wel een privacy issue kijken. Stel je voor dat je bij een bankautomaat je pincode hardop moet opnoemen om toegang te krijgen tot je rekening en vervolgens je saldo wordt opgelezen. Dit is misschien een raar voorbeeld, maar het laat wel goed zien wanneer we wel en niet gebruik kunnen maken van spraakgestuurde technologie in het alledaagse leven. Eten bestellen bij een restaurant zou al een beter voorbeeld zijn. Vooral omdat dit al handelingen zijn die je met spraak doet. McDonald’s is hier al een beetje mee bezig geweest door kassa’s en personeel te vervangen met grote touchscreen schermen waar je visueel je bestelling kan plaatsen en vervolgens met een nummertje je bestelling kan ophalen. Dit is ook een prima voorbeeld van waar je spraakgestuurde technologie kan toepassen, om de interactie nog iets persoonlijker te maken.

Het onderwerp privacy blijft lastig op het gebied van deze technologie, want spraak zal nooit privé zijn tenzij je in een gesloten ruimte zit.

Naast privacy is veiligheid ook nog een aspect bij het hele principe. Je zou dingen kunnen beveiligen met spraakherkenning technologie, alleen blijkt dit vrij makkelijk te omzeilen/hacken zijn. Je zou bijvoorbeeld een stemopname kunnen laten horen om toegang te krijgen tot systemen. Er zou zelfs software ontwikkeld kunnen worden om stemmen te imiteren. Hier zitten verder niet veel wiskundige formules in, zoals bij wachtwoorden, want een stem is een stem. Hij staat ook onder aan het lijstje van de meest betrouwbare “biometrische herkenningen” op het menselijke lichaam. De vingerafdruk staat bovenaan, daarna komt je iris, dan vorm van je hand, en als laatst je gezicht en je stem

(Prabhakar, S., Pankanti, S., & Jain, A. K., 2003).

Mocht je iets beveiligen met stemherkenning, dan zou je in de toekomst je stem moeten verbergen voor de veiligheid. Mensen zullen dit waarschijnlijk heel vervelend vinden, om niet te praten, dus er waarschijnlijk niet voor kiezen om dingen zo te beveiligen. Vooral als je tegenwoordig devices, heel simpel, met je vingerafdruk kan beveiligen.

Naast directe beveiliging van dingen met spraakherkenning, kan spraakgestuurde technologie wel in andere situaties indirecte veiligheid bieden. Bijvoorbeeld in auto’s waar je het multimediasysteem kan besturen met je stem en zelfs je telefoon eraan kan koppelen en die vervolgens met je stem besturen

(Wu, J., Chang, C., Boyle, L. N., & Jenness, J., 2016. p1583–1587). Dan kan je bijvoorbeeld mensen bellen of berichtjes sturen zonder je telefoon aan te raken, routes plannen in je navigatie en de radio veranderen zonder iets aan te raken. Hierdoor kan je je focus op de weg houden zonder te veel afgeleid te worden. Wat ook een vorm van veiligheid biedt.

Conclusie

Tot slot ben ik ervan overtuigd dat spraakgestuurde technologie/UI zeker op bepaalde plekken goed van pas kan komen, maar zeker niet overal handig zal zijn. De bronnen die ik heb gevonden over dit onderwerp zijn het er ook merendeels eens met het feit dat spraakgestuurde technologie vooral een nuttige innovatie is, dus daar kan ik me wel bij aansluiten.

Vooral bij gebruik bij ouderen en gehandicapten in de verzorging lijkt deze technologie goed van pas te komen. Een voorbeeld hiervan is de zorgrobot Alice die door Dr. Johan Hoorn ontwikkeld is. Deze robot help ouderen met alledaagse taken, dingen onthouden en vooral gezelschap te houden door met ze te praten. Uit onderzoek is gebleken dat dit ook vrij effectief is nadat de ouderen er aan gewend zijn. Dit is ook interessant omdat ouderen vaak bekend staan om technologie minder te begrijpen, hoewel dat alleen voor de huidige en misschien nog de komende generatie ouderen zal gelden. Maar juist bij de huidige ouderen, vanwege het spraak aspect, is deze technologie voor hen makkelijk te begrijpen en gebruiken. Daarnaast kan het mensen met een handicap helpen bepaalde handelingen te ondernemen.

Aangezien deze technologie vrij nieuw is en mensen niet gewend zijn te praten met levenloze objecten zal het nog wennen worden voor de meeste mensen. Maar onderzoek naar de natuur van de gesprekken van de mens zorgen voor soepele interactie met deze technologie.

Het openbaar implementeren van deze technologie zal nog een lastige kwestie blijven, maar zal op sommige plekken zeker waarde tonen. Op andere plekken zal het totaal niet werken zoals banken, en andere praktijken waar je met gevoelige informatie overweg moet.

Verder qua veiligheid zijn er zeker veiligere methodes om je privacy mee te beschermen zoals vingerafdrukken. Voor kleinere toepassingen zoals in je ‘smart home’, dat de gebruiker wordt herkend op basis van de stem zou wel heel handig zijn. Ook zou spraakgestuurde technologie, bijvoorbeeld, veiligheid op de weg kunnen vergroten door de besturing van je auto en telefoonsystemen over te nemen.

Hoewel deze technologie erg zwak is op het gebied van veiligheid en privacy, ben ik ervan overtuigd dat het op het gebied van zorg een grote bijdrage kan hebben.

Bronvermelding:

Wetenschappelijke bronnen:

Cohen, M. H., Giangola, J. P., & Balogh, J. (2004). Voice User Interface Design. Nuance Communications, Inc.

Dogru, N. (2017). Smart Homes with Voice Activated Systems for Disabled People. Tem Journal, 6(1), 103–107. Retrieved from http://www.temjournal.com/content/61/TemJournalFebruary2017_103_107.pdf

Moon, I., Lee, M., Ryu, J., & Mun, M. (2003). Intelligent robotic wheelchair with EMG-, gesture-, and voice-based interfaces. Intelligent Robots and Systems. Retrieved from http://ieeexplore.ieee.org/abstract/document/1249690/

Prabhakar, S., Pankanti, S., & Jain, A. K. (2003). Biometric recognition: security and privacy concerns. IEEE Security & Privacy, 99(2), 33–42. Retrieved from http://ieeexplore.ieee.org.ezproxy.hro.nl/document/1193209/

Su, M., & Chung, M. (2001). Voice-controlled human-computer interface for the disabled. Computing & Control Engineering Journal, 12(5), 225–230. Retrieved from http://ieeexplore.ieee.org.ezproxy.hro.nl/abstract/document/962674/

Wu, J., Chang, C., Boyle, L. N., & Jenness, J. (2016). Impact of In-vehicle Voice Control Systems on Driver Distraction. Sage Journals, 59(1), 1583–1587. Retrieved from http://journals.sagepub.com/doi/abs/10.1177/1541931215591342

Andere Bronnen:

Speculatie over de toekomst van voice activated ai

https://techcrunch.com/2015/03/06/the-future-of-voice-activated-ai-sounds-awesome/

Google Conversation Design

https://developers.google.com/actions/design/

Zorgrobot Alice

https://www.voordewereldvanmorgen.nl/duurzame-blogs/de-zorgrobot-collega-of-vervanger