„Stačí testovat s pěti lidmi“: Mýtus nebo pravda?

Romana Fraňková
DESIGN KISK
Published in
5 min readJan 3, 2023

V daném článku se budu více zabývat tím, zda pro uživatelské testování stačí pouze pět lidí, či se jedná jen o mýtus, který se šíří v celé designérské populaci. Zaměřím se na to, jak na danou problematiku nahlíží více autorů, a jak tento názor vlastně vznikl. Dále se také zaměřím na to, jak zajistit, aby nám stačil, co nejmenší počet testerů při testování daného webu, či aplikace.

Jistě se shodneme na tom, že testování je neodmyslitelnou součástí při vývoji a upgradu nejen služeb. Pojďme se však nyní společně podívat na to, zda je testování pouze s pěti lidmi skutečně dostačující, nebo se jedná pouze o mýtus, který se masivně šíří napříč designérskou populací. Jak z logiky věci vyplývá, tak by samozřejmě bylo nejlepší provádět uživatelský test se všemi uživateli, kteří danou službu budou využívat, abychom zachytili všechny možné chyby, které se zde budou nacházet. Pravdou však zůstává, že takto rozsáhle testování je téměř nemožné, a i kdybychom našli způsob, jak jej realizovat, tak bude s největší pravděpodobností příliš nákladné a náročné na zpracování. I proto výzkumníci přicházejí s různými nápady, jak celý proces zachovat efektivní, ale zároveň snížit jeho náklady a náročnost.

S teorií, že k testování stačí pouze pět uživatelů, se setkáváme u Nielsona, který rovněž popisuje proč. Abych zde dlouze nepopisovala, jak jeho teorie funguje, tak ji zkrátím na základní popis. Největší počet chyb odhalí již první uživatel, každý další znovu upozorní na nesrovnalosti od těch předchozích, a k tomu přidá i další, které jsou způsobeny tím, že má na věc jiný pohled[1]. S přibývajícími testovacími subjekty se tedy dozvídáme méně a méně nesrovnalostí, zde je však nutné podotknout, že daných pět uživatelů, kteří službu testují, neodhalí všechny problémy, ale pouze jejich určitou část, která se může rovnat 85%, a to pouze v případě, že daný problém je problém pro 1 ze 3 uživatelů[2]. Danou teorii reprodukuje spousta autorů a využívá ji také, když o tomto tématu hovoří ve svých pracech.

V tuhle chvíli je nutné si uvědomit, že testování neprovádíme pouze jednou, nýbrž opakovaně. Po každém testování vždy naši službu upravíme, a poté znovu provádíme testování. I tohle přispívá k lepšímu odhalení chyb, ale opět nebudeme schopni odhalit všechny, a to zvláště v případě, kdy testujeme se skupinou, pro kterou je snadné se zorientovat v internetovém prostředí. Pokud je naším cílem navrhnout uživatelsky přístupné internetové rozhraní, je v našem největším zájmu testovat na běžných uživatelích, s různými znalostmi v používání internetových služeb. Je tedy patrné, že se můžeme bavit o tom, že by pouze pět uživatelů mohlo být dostačujících pro odhalení většiny problémů, které se v daném internetovém rozhraní nachází.

Oproti tomuto názoru, zde však máme Steva Kruga, který ve svém návodu na uživatelské testování, dokonce uvádí, že stačí pouze tři uživatelé. Samozřejmě si všichni dovedeme tu spoustu výhod, jako je, že se tři uživatelé snadněji shání, výsledky se rychleji zpracovávají, a je menší pravděpodobnost, že vás dané testování přestane bavit.[3] Celkově však shrnuje, že vhodný počet testerů se pohybuje mezi třemi a šesti lidmi. Nicméně si zde musíme uvědomit, že při snižování počtu testerů může dojít ke stejnému problému, jako uvádí Nielson u testování s pěti uživateli, a to k tomu, že špatně vybereme vzorek uživatelů, a ti nám nakonec neodhalí téměř žádné množství problémů, které mohou běžným, či nově příchozím uživatelům komplikovat používání našeho webu. Opět se tedy dostáváme k tomu, co je klíčové k odhalení, co největšího množství chyb a problémů v námi nadesignovaném webu. Jedná se o to, kdo bude danou službu testovat, a jak si „správného“ testera zvolit.

Samozřejmě to, kdo bude testovat nelze určit jednotně, vždy záleží na tom, co zrovna potřebuji otestovat, a pro koho danou službu děláme. Rovněž je i zřejmé, že třemi, či pěti uživateli nejsme schopni pokrýt všechny možné typy našich uživatelů. Přesto, že je můžeme rozdělit, na začátečníky, běžné uživatele a „profesionály“, nebo jakékoli rozdělení, které nás napadne. I v rámci těchto skupin jsou různé podskupiny uživatelů, kteří mají rozdílné potřeby. Krug[4] uvádí, že pro začátek je pro testování dobré vzít téměř kohokoli. Samozřejmě, když například testujeme nový systém, ve kterém pracují lidé v určité firmě, tak nebudeme pro testování hledat někoho z ulice, ale v rámci firmy se nám hodí téměř kdokoli, i člověk, který není naší cílovou skupinou, a daný systém již nebude v budoucnu požívat, totiž může odhalit spoustu chyb, na které bychom s našimi cílovými uživateli ani nemuseli přijít. Nicméně i naši cíloví uživatelé jsou samozřejmě vhodní pro uživatelské testování, a pokud jsme to schopni zajistit je dobré, právě naše cílové uživatele pro tyto účely využít. Testery by však neměli být přímo tvůrci, či profesionálové.

Dalším aspektem při uživatelském testování, které má vliv, na odhalení chyb, je právě úkol, který mají testeři zadaný. Barnum[5] uvádí, že vhodné je zvolit cíl, kterého má daný uživatel dosáhnout, a poté sledovat, jeho vlastní postup, jakým se k danému cíli dopracuje. Naopak vytvářené přímých scénářů by mohlo být problematické a nemuselo by nám ukázat všechny problémy, na které by mohl uživatel narazit při běžném užívání našeho webu. Při testování tedy dáváme přednost cíli, kterého má uživatel dosáhnout, a poté sledování jeho celého postupu, před zadáváním přímých úkolů. Tak jsme schopni lépe odhalit problémy, které se v daném webu nachází.

Závěr a shrnutí

Když se zamyslíme nad celým tématem, je zřejmé, že vždy záleží na tom, co je našim cílem při testování. V tomto článku se dozvídáme, že nám klidně i mohou stačit pouze tři uživatelé. To jak k tomuto číslu Krug došel, však není jisté. Nielsen svůj názor, že stačí pouze pět uživatelů, obhajuje o něco lépe. U obou těchto autorů však zůstává důležité, být si vědom toho, že velmi záleží na tom, jaké testery zrovna máme k dispozici. Celkově se však shodují, že vhodný počet testerů se pohybuje mezi třemi a šesti lidmi. Ale také zmiňují, že i v případě, že budeme mít sto testerů, pokud budou špatně zvolení, tak nedosáhneme takových výsledků, jako, když zvolíme tři testery správným způsobem. Zároveň si musíme být vědomi toho, že testování musíme provádět opakovaně, ideálně po každé změně, abychom zajistili, co nejlepší výsledky. Našimi testery nemusí být pouze běžní uživatelé, rozhodně by to však neměli být profesionálové, či dokonce tvůrci daného webu. Stejně tak, jako kdo testuje je pro nás důležité to, co je testováno, Barnum nám říká, že je lepší volit spíše cíl, kterého má uživatel při testování dosáhnout, a poté sledovat, celý jeho postup, než vytvářet přímé scénáře, které nám nemusí odhalit všechny problémy.

[1] NIELSON, Jakob. Why you only need to test with 5 users [online]. 2000. Dostupné z: https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/

[2] TRAVIS, David. How to find more usability problems with fewer users [online]. 2017. Dostupné z: https://www.userfocus.co.uk/articles/more-usability-problems-with-fewer-users.html

[3] KRUG, Steve. Nenuťte uživatele přemýšlet. Brno: Computer Press, 2010. 165 s. ISBN 978–80–251–2923–4.

[4] Tamtéž, str. 46.

[5] BARNUM, Carol. N. Usability Testing Essentials: Ready, Set …Test!. 2nd. Morgan Kaufmann Publishers, 2020.

--

--