Co chystá budoucnost pro Wikipedii?

Eliška Lorenzová
EDTECH KISK
Published in
3 min readMar 27, 2023
Photo by Oberon Copeland @veryinformed.com on Unsplash

Wikipedie je otevřená encyklopedie a je považována za jeden z nejvýznamnějších informačních zdrojů dnešní doby, a to i přesto, že informace, které obsahuje, nemůžeme vždy považovat za ověřitelné a důvěryhodné. Obsahuje miliony příspěvků a každý měsíc přibývají další a další tisíce (Petroni a kol., 2022). Příspěvky tvoří miliony dobrovolníků z celého světa, kteří jsou označováni jako Wikipediáni. A přestože to nebyl záměr, stali se tito editoři a redaktoři virtuální odbornou komunitou (virtual community of practice) (Hara a kol., 2010). Odborné komunity jsou komunity lidí, kteří sdílí stejné obavy a nadšení pro to, co dělají a skrze kolektivní vzdělávání se učí, jak to dělat lépe (Wenger, 2022).

Narůstající popularita Wikipedie, velké množství stávajících a přibývajících příspěvků, které může kdokoliv upravovat, a další faktory, přináší spoustu výzev. Přestává být reálné, aby veškeré ověřování změn, informací a zdrojů prováděli jen a pouze Wikipediáni. Pro usnadnění této práce začínají využívat např. strojové učení, zpracování přirozeného jazyka.

Možnosti zjednodušení práce skrze:

- Fact-checking

Jak již bylo zmíněno, kdokoliv se může podílet na úpravě příspěvků. To může vést k poskytování zavádějících a nesprávných informací a než dojde k jejich opravě, mohou napáchat škody různých typů.

Wikipedie pracuje na implementaci AI systému, založeném na strojovém učení. Jeho cílem je případné chyby a stopy vandalismu rozpoznat. K tomu dochází na základě identifikování běžných vandalistických vzorců. Dochází tak k automatizování editorských prací, což znamená, že dojde ke snížení Wikipediánů, kteří informace obsažené v příspěvcích ověřují (Chakraborty, 2021).

- Ověřování citací

S fact-checkingem je spojeno i ověřování samotných odkazů v textu, citací. Může se totiž stát, že informaci nelze označit za pravdivou či nepravdivou, protože k ní jednoduše nejsou dodány náležité zdroje. Další ne příliš příjemná situace pro uživatele nastává v momentě, kdy je odkazovaný zdroj nedohledatelný, např. z důvodu chybných autorských údajů v citaci, nebo jen a pouze z důvodu neexistujícího odkazu na webovou stránku.

Potenciální řešení přináší Meta, která vytvořila systém SIDE založený na neuronové síti. Systém ověřuje citace a v případě, že zdroj nedokáže ověřit, skenuje web a hledá alternativy. Učí se ze samotného korpusu Wikipedie skrze dva přístupy. V prvním dochází k rozkladu vyhledávaného komponentu na symbolické a neuronové vyhledávací dotazy, což umožňuje optimalizaci vyhledávání a výběr relevantních citací na webech. V druhém přístupu pak vyhodnocuje pravděpodobnost správnosti citace na základě porovnání její podoby s citacemi již ověřenými (Petroni a kol., 2022).

Samotný výzkumný proces je popsán v článku dostupném skrze tento odkaz.

- Generování textů

Potenciál využití AI je i v samotném generování textů příspěvků. Google Brain pracuje s modelem, který se nejdříve seznámí se strukturou, které stránky na Wikipedii zpravidla mají. Poté sumarizuje informace nalezené v online zdrojích a vygeneruje text. Tento potenciál zatím zůstává nenaplněný. Ačkoliv dochází k pokrokům, ukázalo se, že vygenerované texty nejsou v takové kvalitě, v jaké by mohly být napsány člověkem (Chakraborty, 2021).

Wikipedie je crowdsourcový projekt, tvořen lidmi pro lidi. Alespoň zatím. A tím, co pro největší online encyklopedii, chystá budoucnost, se můžeme nechat překvapit.

Použité zdroje

Chakraborty, M. (2022). Wikipedia Uses Artificial Intelligence in These Amazing Ways. Analytics Insight. Získáno 17. března 2023, z https://www.analyticsinsight.net/wikipedia-uses-artificial-intelligence-in-these-amazing-ways/

Hara, N., Shachaf, P., & Hew, K. F. (2010). Cross-cultural analysis of the Wikipedia community. Journal of the American Society for Information Science and Technology, 61(10), 2097–2108. https://doi.org/10.1002/asi.21373

Petroni, F., Broscheit, S., Piktus, A., Lewis, P., Izacard, G., Hosseini, L., Dwivedi-Yu, J., Lomeli, M., Schick, T., Mazaré, P.-E., Joulin, A., Grave, E., & Riedel, S. (2022). Improving Wikipedia Verifiability with AI. https://doi.org/10.48550/ARXIV.2207.06220

Wenger, T. (2022). Introduction to communities of practice. Získáno 17. března 2023, z https://wenger-trayner.com/introduction-to-communities-of-practice/

--

--