Co chystá budoucnost pro Wikipedii?
Wikipedie je otevřená encyklopedie a je považována za jeden z nejvýznamnějších informačních zdrojů dnešní doby, a to i přesto, že informace, které obsahuje, nemůžeme vždy považovat za ověřitelné a důvěryhodné. Obsahuje miliony příspěvků a každý měsíc přibývají další a další tisíce (Petroni a kol., 2022). Příspěvky tvoří miliony dobrovolníků z celého světa, kteří jsou označováni jako Wikipediáni. A přestože to nebyl záměr, stali se tito editoři a redaktoři virtuální odbornou komunitou (virtual community of practice) (Hara a kol., 2010). Odborné komunity jsou komunity lidí, kteří sdílí stejné obavy a nadšení pro to, co dělají a skrze kolektivní vzdělávání se učí, jak to dělat lépe (Wenger, 2022).
Narůstající popularita Wikipedie, velké množství stávajících a přibývajících příspěvků, které může kdokoliv upravovat, a další faktory, přináší spoustu výzev. Přestává být reálné, aby veškeré ověřování změn, informací a zdrojů prováděli jen a pouze Wikipediáni. Pro usnadnění této práce začínají využívat např. strojové učení, zpracování přirozeného jazyka.
Možnosti zjednodušení práce skrze:
- Fact-checking
Jak již bylo zmíněno, kdokoliv se může podílet na úpravě příspěvků. To může vést k poskytování zavádějících a nesprávných informací a než dojde k jejich opravě, mohou napáchat škody různých typů.
Wikipedie pracuje na implementaci AI systému, založeném na strojovém učení. Jeho cílem je případné chyby a stopy vandalismu rozpoznat. K tomu dochází na základě identifikování běžných vandalistických vzorců. Dochází tak k automatizování editorských prací, což znamená, že dojde ke snížení Wikipediánů, kteří informace obsažené v příspěvcích ověřují (Chakraborty, 2021).
- Ověřování citací
S fact-checkingem je spojeno i ověřování samotných odkazů v textu, citací. Může se totiž stát, že informaci nelze označit za pravdivou či nepravdivou, protože k ní jednoduše nejsou dodány náležité zdroje. Další ne příliš příjemná situace pro uživatele nastává v momentě, kdy je odkazovaný zdroj nedohledatelný, např. z důvodu chybných autorských údajů v citaci, nebo jen a pouze z důvodu neexistujícího odkazu na webovou stránku.
Potenciální řešení přináší Meta, která vytvořila systém SIDE založený na neuronové síti. Systém ověřuje citace a v případě, že zdroj nedokáže ověřit, skenuje web a hledá alternativy. Učí se ze samotného korpusu Wikipedie skrze dva přístupy. V prvním dochází k rozkladu vyhledávaného komponentu na symbolické a neuronové vyhledávací dotazy, což umožňuje optimalizaci vyhledávání a výběr relevantních citací na webech. V druhém přístupu pak vyhodnocuje pravděpodobnost správnosti citace na základě porovnání její podoby s citacemi již ověřenými (Petroni a kol., 2022).
Samotný výzkumný proces je popsán v článku dostupném skrze tento odkaz.
- Generování textů
Potenciál využití AI je i v samotném generování textů příspěvků. Google Brain pracuje s modelem, který se nejdříve seznámí se strukturou, které stránky na Wikipedii zpravidla mají. Poté sumarizuje informace nalezené v online zdrojích a vygeneruje text. Tento potenciál zatím zůstává nenaplněný. Ačkoliv dochází k pokrokům, ukázalo se, že vygenerované texty nejsou v takové kvalitě, v jaké by mohly být napsány člověkem (Chakraborty, 2021).
Wikipedie je crowdsourcový projekt, tvořen lidmi pro lidi. Alespoň zatím. A tím, co pro největší online encyklopedii, chystá budoucnost, se můžeme nechat překvapit.
Použité zdroje
Chakraborty, M. (2022). Wikipedia Uses Artificial Intelligence in These Amazing Ways. Analytics Insight. Získáno 17. března 2023, z https://www.analyticsinsight.net/wikipedia-uses-artificial-intelligence-in-these-amazing-ways/
Hara, N., Shachaf, P., & Hew, K. F. (2010). Cross-cultural analysis of the Wikipedia community. Journal of the American Society for Information Science and Technology, 61(10), 2097–2108. https://doi.org/10.1002/asi.21373
Petroni, F., Broscheit, S., Piktus, A., Lewis, P., Izacard, G., Hosseini, L., Dwivedi-Yu, J., Lomeli, M., Schick, T., Mazaré, P.-E., Joulin, A., Grave, E., & Riedel, S. (2022). Improving Wikipedia Verifiability with AI. https://doi.org/10.48550/ARXIV.2207.06220
Wenger, T. (2022). Introduction to communities of practice. Získáno 17. března 2023, z https://wenger-trayner.com/introduction-to-communities-of-practice/