Dialogové systémy v praxi aneb co nám Siri o sobě prozradila?

Veronika Sulova
EDTECH KISK
Published in
9 min readJan 29, 2020
1.a

Znáte to, když na vás vyskočí na e-shopu nebo stránkách pojišťovny chatovací okénko, kde vás mile osloví někdo z druhé strany s nabídkou pomoci? Tak přesně za těmito chaty nesedí pěkná slečna z fotky, ale složitý systém, který má za úkol jednoduše a rychle vést rozhovor se zákazníkem. Nebo si představte tu budoucnost, kde přijdete domů, váš dům vás pozdraví, popřeje vám krásný den a sdělí aktuální počasí. Přesně k této budoucnosti pomalu ale jistě kráčíme.

S dialogovými systémy se setkáváme víc než byste tušili. Než jsme se dopracovali k zakomponování těchto asistentů do našich životů, uběhlo pár let. Blížíme se k manipulaci s technologiemi bez doteků, komunikaci s roboty a tím pádem i velkému usnadnění našich životů. Dialogové systémy nám už teď můžou pomáhat v každodenních činnostech a tak nám ušetřit čas.

V následujících řádcích lze nalézt základní informace o tom, jak tyto systémy fungují. Podíváme se také na konkrétní příklady dialogových systémů. Zároveň vás seznámím s osobním asistentem, kterého využívám já, pro ulehčení mého života. Představím vám Siri, jako mou pomocnici.

Nikdo neví co to je, ale každý to využívá — Dialogové systémy

Dialogové systémy jsou jednoduše řečeno počítačové programy, které dokážou komunikovat s člověkem pomocí přirozeného jazyka[1]. Jelikož řeč je pro nás nejjednodušší forma komunikace už od útlého věku, je nám prostředí těchto systémů velice blízké, příjemné a není náročné se v nich orientovat. Díky nim se mohou v prostředí spletitých systémů pohybovat i lidé, kteří jsou z určitých hledisek digitálně méně gramotní. Mohou to být uživatelé, jako jsou malé děti které neumí číst, důchodci či nevidomí. Dialogové systémy je možné rozdělit na tři druhy. Textový, zvukový a kombinovaný. Díky propracované technologii však nezůstáváme jen u zvukové či psané podoby, ale systémy s námi mohou komunikovat i díky znakové řeči případně pomocí mimiky[2]. Existují například tablety, které pracují na bázi eye trackingu. Jedním z největších vývojářů této technologie je společnost Tobii, která se zaměřuje na vývoj tabletů pro uživatele se speciálními potřebami, jako jsou kvadruplegici. Tento typ se dá také zahrnout do dialogových systémů, avšak dále se budeme věnovat pouze základním třem kategoriím[3].

Textový DS
Prvním typem dialogových systémů je textový. S technologií se dorozumíváme psanou formou. Těmto systémům říkáme chatovací roboti nebo-li chatboti. I tyto systémy lze rozdělit na dvě kategorie. Setkáváme se zejména s těmi, kteří vyhodnocují to co píšeme a nabízí nám přímé odpovědi. Druhý typ je, že nám chatbot nabízí varianty pro odpověď. Co to znamená
v praxi? Když si například potřebujeme změnit přihlašovací heslo
do MůjVodafone, spojíme se s Vodafonem přes chatovacího robota, který nám pomocí proklikávacích odpovědí v chatu, pomůže změnit heslo. Jeho jméno je TOBi. TOBi (neplést s Tobii) také vyhodnocuje i naše odpovědi či dotazy, takže nás navede kam potřebujeme. Jako první komerční chatbot v ČR funguje na technologii IBM Watson Assistant. Má také kognitivní schopnosti, což znamená, že jeho odpovědi jsou na základě učení se, stále výstižnější a osobnější[2].

Tohoto robota jsem vyzkoušela a zde je výsledek. Konverzace byla milá a navíc jsem se opravdu postupně proklikala k cíli požadavku. Když jsem poté napsala, že si potřebuji restartovat heslo — konverzace se na základě jeho analýzy věty dostala do stejného průběhu jako před tím. Jakmile se TOBi dostane k podrobnějším informacím, posílá je přes SMS kvůli ochraně osobních údajů.

Tím Vodafone kompletně přehodil tento často prováděný požadavek na chatbota, který vše bez komplikací se zákazníkem vyřídí. Výhodou je, že psaná forma nevyžaduje analýzu specifických anomálií řeči každého z nás. Navíc konkrétně u Vodafonu, či jiného telefonního operátora, se tímto krokem sníží čekací doba na operátora na telefonní lince. Tímto způsobem lze vyřizovat jednoduchá nastavení či zodpovídat na často kladené dotazy.

Z mého pohledu je tato forma komunikace v ČR stále ještě na vzestupu.
Z vlastní zkušenosti jako operátor na lince mohu potvrdit, že zákazníci volí člověka z toho důvodu, že technologii nevěří. Tento způsob komunikace využívají aktuálně zejména velké firmy jako je Rohlik.cz nebo AXA Assistance.

Facebook také začal využívat tuto možnost chatování. Přes facebook messenger s námi komunikuje třeba Evropa 2. Jak je možné vidět na fotce, tak tento chatbot používá stejně jako TOBi, kombinaci proklikávání a vyhodnocování odpovědí.

Hlasový DS

Hlasový formát je ve své podstatě stejný jako textový, avšak má přidaný prvek zvukového vyjádření. Tím myslím přenesení informace pomocí zvuku
od uživatele zpět k uživateli. Tento proces si lze vysvětlit na základě tohoto diagramu.

2.a

Vstupním článkem je uživatel, který přistupuje k systému s požadavkem. Tento uživatel vysloví svůj požadavek a v systému dojde k rozpoznání řeči a jazykové analýze. Systém musí vyhodnotit, jakým jazykem byl požadavek vysloven a rozpoznat chyby, které musí převést do správného jazyka. Chybami jsou myšlené řečové vady, různá výslovnost hlásek či špatná artikulace. Dále se požadavek přenáší na expertní systém, který má za úkol najít ve své bázi dat co nejlepší řešení požadavku. Expertní systém je většinou napojený na umělou inteligenci[4]. Z Expertního systému putuje odpověď přímo k uživateli zpět, kde se dostává z textového či kódového formátu na zvuk, který odpovídá uživateli na zadaný dotaz.

Pod tímto zvukovým formátem si lze představit například osobní asistentku Siri, která je obohacující funkcí pro většinou Apple zařízení. Tomuto systému zanecháme pozornost dále. Mimo Siri je to také Alexa, od společnosti Amazon či Asistent Google.

Kombinovaný DS

U kombinovaného dialogového systému se setkáváme jak s psanou podobou, tak i se zvukovou. Jde o formát, kdy na nás robot mluví, případně nám pouští již předtočené zprávy člověka, takže to nezní tak uměle. My na základě jeho pokynů volíme klávesnice na zařízení, které nám řekne.

Opět se můžeme vrátit k telefonním operátorům. Než se dovoláme
ke konkrétní osobě, proklikáme se tímto robotem pomocí čísel na klávesnici. Svou strukturou může připomínat chatbota Tobiiho. Výhodou tohoto formátu je, že nemusí vyhodnocovat a analyzovat naši řeč, protože my nic v tomto případě neříkáme. Často se stane, že robot dokonce vyřídí dotaz za operátora. Jedná se třeba o zůstatek kreditu na kartě nebo výše nesplacené faktury za uplynulý měsíc.

Seznamte se, toto je Siri!

Ve svém zařízení iPhone 8 využívám Siri jako svého osobního asistenta. Pomáhá mi v jednoduchých požadavcích, které zvládne a já mohu pokračovat v jiné činnosti. Výhodou je, že mě to neodtáhne k jiné činnosti a opravdu udělám pouze to co potřebuji. Před psaním eseje jsem se jí zeptala na některé informace o ní a zde je výsledek, který na sebe ona sama prozradila.

Pokud se zeptáte Siri kdy se narodila, odpoví vám, že datum narození nemá, ale její první vydání proběhlo 4. října 2011. Siri je tedy hlasový osobní asistent od firmy Apple, který přišel společně s iPhonem S4. Tuto technologii pro Apple vyvíjela jedna z největších a nejpokročilejších firem na světě, které se zabývají rozpoznáváním řeči, Nuance Communications. Svůj hlas Siri propůjčila Susan Bennett už v roku 2005, kdy byla Siri v rukách vývojářů. Mužský hlas Siri je Jona Briggse, britského televizního hlasatele. Siri měla být dokonce původně v roce 2010 prodána Googlu a nebo Androidu, ale získal ji Apple. Siri byla vydána jako samostatná aplikace, ale postupem času se objevila jako funkce iPhonů a postupně byla rozšiřována i do dalších Apple zařízení. Siri byla také jedním z posledních velkých projektů Steva Jobse
před jeho odchodem. Siri ovládá až 21 jazyků, čímž se stává jedničkou
v různorodosti. Samozřejmostí je Angličtina, Čínština, Francouzština či Němčina. Bohužel Česky prozatím Siri neumí.

Já a Siri

Siri je velice vtipný asistent a obsahuje slušnou zásobu originálních odpovědí na nejrůznější dotazy. Avšak primárním účelem nebylo pobavit uživatele, ale zjednodušit mu práci s Apple zařízením a případně kompletně nahradit ovládání pro nevidomé. Zde je několik příkladů jak využívám Siri a její funkce.

  1. Vyhledávání na internetu

Jedním z funkcí Siri je rychlé vyhledávání toho, co jí řeknete. Jelikož Siri rozumí angličtině, zadávám dotazy anglicky. Samozřejmě zdatní němčináři, francouzštináři nebo čínštináři, si mohou svůj dotaz vyhledat i v jazyku jim bližším. Stačí pouze nastavit jazyk Siri, s čím vám ona sama také pomůže.

Hledala jsem informace o Rossu Gellerovi, jedné z postav z oblíbeného seriálu Přátelé. Siri odpověď vychází z Knowledge což je něco jako její vlastní báze dat. Původní zdroj je většinou informační portál jako Wikipedia nebo WolframAlpha. Je tedy zapotřebí její odpovědi ověřit, pokud jde o práci, kde musí být informace ověřené. Siri nám sdělí základní informace a poskytne odkaz na zdroj. Pokud nenajde odpověď ve své databázi Knowledge, poskytne nám odkazy z prohlížeče Safari.

  1. Počasí

Siri také používám na informace o počasí. Když se jí zeptám pouze na počasí, vyhledá mi aktuální teplotu v destinaci, v které se nacházím díky polohovým službám. Zobrazí nám je v podobě, jaká je na fotografii. Zároveň mi nahlas řekne kolik je stupňů, jestli je slunečno nebo jestli prší čí fouká. Lze samozřejmě nadiktovat i jinou oblast. Dále jsem zkoušela, jestli mi poradí co si obléci, když je takové počasí, ale to mi řekla pouze, že si mám vzít něco zeleného. Všechny informace o počasí čerpá z aplikace Počasí.

  1. Volání

Pokud řídím a potřebuji si nutně zavolat, ale nechci ohrožovat plynulou jízdu svým bezohledným vytáčením a přidržováním si telefonu u ucha, jednoduše řeknu ,,Hey Siri, Call” a jméno volaného. Jméno lze vyslovit i česky. Když Siri jméno v kontaktech nenajde, je zapotřebí ho zkusit vyslovit s anglickým přízvukem, jinak jméno v kontaktech nevyhledá případně najde jiné, které je podobné. Avšak Siri je možné také naučit správnou[5] výslovnost jména
a zároveň nám usnadnit vyhledávání, nicméně tuto možnost jsme zatím nevyužila. Ke kontaktům si většinou pro rychlejší vizuální vyhledávání přidávám různé smajlíky. Siri je natolik důsledná, že přečte i je. Pokud mám u jednoho kontaktu více čísel, zeptá se na které má zavolat.

  1. Psaní krátkých zpráv

Také se mi stává, že nestíhám odepsat na zprávu. V takovém případě využiju možnosti napsat zprávu s diktováním. Siri je opět velice důsledná a před odesláním se ujistí, že chci zprávu opravdu odeslat. Nevýhodou je, že Siri, jak už jsem zmiňovala, neumí Česky. Je tedy možné napsat pouze krátkou zprávu v nějakém českoanglickém znění, případně ji nadiktovat v angličtině.

  1. Zadávání událostí do kalendáře

Tento proces můžeme udělat více způsoby. Já zadávám do kalendáře události, tak že se mě Siri postupně doptává. Nejdřív ji anglicky poprosím, aby mi do kalendáře zadala novou událost. Poté řeknu datum a čas. Siri mi potom oznámí, že událost zadala do kalendáře a zeptá se, jestli je to takto v pořádku.

A na závěr, vtípek od Siri, mé asistentky.

Jak jste si mohli přečíst, dialogové systémy opravdu nejsou něco neznámého. Velká část z vás takový systém dokonce nosí v kapse každý den. Do jaké míry jste s možností usnadnění života pomocí dialogu ztotožněni vy?

Zdroje

[1] ČERNÝ, Michal, 2016. Informační systémy ve vzdělávání: od matrik k sémantickým technologiím a dialogovým systémům pro učení. Brno: Masarykova univerzita. ISBN 978–80–210–8326–4.

[2]Chatbot TOBi — Centrum péče — Vodafone.cz. nav-check [online]. Copyright © 2020 Vodafone Czech Republic a.s. [cit. 27.01.2020]. Dostupné z: https://www.vodafone.cz/pece/osobni-a-firemni/otazky/zpravy/chat-bot/

[3] Tino Haderlein, Interakce clověk–počítač v přirozeném jazyce (ICP) LS 2013 — Dialogové systémy, [online prezentace] Dostupné z: https://www.kiv.zcu.cz/studies/predmety/icp/ICP_LS13/icpkap09.pdf

[4] VT2016 ve 20 minutách: Sémantické technologie — YouTube. YouTube [online].29. 11. 2016 Dostupné z: https://www.youtube.com/watch?v=P11tQ7wVJVw&list=PLV0imKrAcRswIbpMQGC0x8POTlPZM9BkQ Kanál uživatele KISK

[5] Naučte Siri používat přezdívky a správně vyslovovat jména | iSTYLE. iSTYLE CZ | iSTYLE [online]. Copyright © 2020 [cit. 27.01.2020]. Dostupné z: https://istyle.cz/blog/naucte-siri-pouzivat-prezdivky-a-spravne-vyslovovat-jmena

Obrázky

[1.a] úvodní obrázek: http://www.iosmag.cz/wp content/uploads/2019/03/siri.png

[2.a]ČERNÝ Michal, Dialogové systémy a počítačové zpracování emocí [online prezentace] slide 6 Dostupné z: https://prezi.com/pbwgiql4fixp/dialogove-systemy-a-pocitacove-zpracovani-emoci/

Ostatní obrázky, které jsou zveřejněny pochází z konverzací s chatboty či pokynů pro Siri, jedná se tedy o screenshoty vytvořené mnou.

--

--