Interfaces de recherche : principes d’utilisabilité

Nous proposons ici un compte rendu du deuxième chapitre du livre Modern Information Retrieval (2005), écrit par Marti Hearst, professeure à l’UC Berkeley School of Information et affiliée à la Computer Science Division de la même université. Dans ce chapitre Hearst fait état des principales études au sujet des interfaces de moteurs de recherche sur le Web. En prenant comme point de départ les habitudes et les stratégies de recherche employés par la plupart des usagers dans le contexte du Web, elle présente des données empiriques sur les préférences d’utilisation, les façons de spécifier les requêtes et les outils de support à la recherche les plus appréciés par les utilisateurs.

Hearst (2005) préconise que le rôle de l’interface d’un moteur de recherche est d’aider l’usager à comprendre et à exprimer son besoin informationnel, à interpréter les résultats retournés et à retracer le progrès de son processus de recherche. L’interaction de l’usager avec l’interface diffère selon la complexité de la tâche que ce dernier doit accomplir. Dans le contexte où l’usager doit consulter une information simple (Information Lookup), tel que la méteo, un boîte de recherche peut répondre adéquatement à son besoin. Par contre, dans le contexte d’une recherche exploratoire (Exploratory Search), où l’usager doit au même temps investiguer et apprendre sur le sujet qu’il cherche, il est nécessaire de présenter des modèles d’interaction plus spécialisés lui permettant de spécifier des critères plus fins et de pouvoir surveiller le thème au fil du temps. La recherche exploratoire a un caractère très dynamique, dans le sens qu’un besoin informationnel déclenche d’autres besoins complémentaires et ammène l’usager à explorer des directions très différentes du point de départ initial.

Par rapport à ce caractère dynamique de la recherche exploratoire, Hearst (2005) nous présente deux comportements observés chez les usagers par rapport aux interfaces de recherche. Le premier c’est une stratégie appellé de test the waters où l’usager fait un requête générale sur un sujet afin de voir les résultats qui ressortent, et sur la base des mots retrouvés dans les résultats, il reformule la requête pour atteindre plus de proximité du cible qu’il veut atteindre. Le second, connu comme orientering, se refère à l’habitude de faire une requête rapide et imprécise dans le but de resteindre les résultats de manière aproximative et ensuite, de procéder à une série d’opérations de navigation pour se rapprocher davantage de l’information recherchée.

Le constat de ce genre de comportement dans les études récentes sur l’interaction des usagers avec les interfaces de recherche, reflète une nette préférence pour la navigation comparativement à la formulation de requêtes. “Browsing is often preferred because it is mentally less taxing to recognize a piece of information than it is to recall or remember it”. (Hearst, 2005, p. 24). Hearst explique qu’une structure de navigation basée sur une système de catégorisation par facettes cohérente, est très apprécié par la plupart des usagers, même s’ils cette structure leurs ammène à cliquer plusieurs fois jusqu’à ce qu’ils accomplissent leur recherche. L’opération de raffinement donne l’impression que l’usager est de plus en plus proche de sa cible, ce qui lui confère plus de confiance vis-à-vis le système.

Hearst (2005) fait état des principales découvertes des études sur les interfaces de recherche, résumées dans la liste ci-dessous :

- Les usagers reformulent leurs requêtes dans la plupart des cas, avec une legère modification;
- Les usagers recherchent avec fréquence de l’information qu’ils ont déjà accèdé dans le passé;
- Les stratégies de recherche changent lorsque les usager recherchent des contenus dèjà recherchés précedemment;
- Plusieurs chercheurs ont développé des interfaces qui prennent en compte la possibilité des usager de reaccéder à des recherches effectuées ou à des documents déjà consultés;
- Les usagers ont de la difficulté de juger la pertinence d’un document vis-à-vis un thème recherché, surtout ceux qui ne sont pas familiers avec le sujet de la recherche. Pour cela, les usagers ont la tendance de ne considérer que les documents qui s’affichent dans les premiers rangs des résultats. La persistence de l’usager est un facteur important pour trouver des bons résultats et cette caractéristique est souvent retrouvé dans les experts (usagers qui connaissent les thèmes auxquels ils cherchent);
- Les requêtes dans le Web aujourd’hui sont très courtes, composées d’un à trois mots-clés. Les recherches avec plusieurs mots-clés sont fréquemment formulées sous la forme de phrases, qui peuvent comprendre plusieurs sujets ou encore un sujet avec plusieurs facettes: Exemple : élections municipales Montréal;
- Les expériences avec des moteurs de recherche dans le Web ont enseigné aux usagers que la formulation de requêtes très détaillées donne des mauvais résultats;
- La plupart des usagers ne comprend pas les opérateurs boeléens et trouvent difficile de faire des requêtes en utilisant des expressions de syntaxe (clés de recherche, opérateurs, etc.). À cause de cela, les moteurs de recherche modernes pondérent les résultats en considérant la proximité entre les termes de la recherche dans les documents retournés.
- La largeur de la boîte de recherche influe sur la largeur de la requête lancée par l’usager;

Une grande partie de l’article de Hearst (2005) est consacré à présenter et à décrire un ensemble de composantes qui sont devenus des standards dans les interfaces de recherche. Il s’agit d’outils de support offerts dans les différentes étapes du processus de recherche, que l’auteure définit comme étant un cycle qui consiste à la spécification d’une requête, l’inspection des résultats repérés et la reformulation de la requête. Voici quelques exemples:

Composantes d’interface de moteurs de recherche

Formulaires composés

yelp.com
 Filtres pour restreindre les mots-clés à une région géographique ou à une autre dimension pertinente à la collection. Le filtre permet de sélectionner les critères utilisés dans le passé.

Suggestion de requêtes

zvents.com
 Mettre des textes grisés dans les boìtes de recherche en fournissant des conseils sur le type d’information à saisir.

Auto-compléter

netxbio.com
 Inclusion de suggestions de requêtes. Ces suggestions peuvent être dérivées par l’hisorique de recherche ou basé sur les requêtes les plus populaires d’autres usagers. Les suggestions peuvent être groupés par catégorie.

Raffinement de la requête

yahoo.com
 Suggestions pour raffiner la recherche, liens vers d’autres type de ressources (images, article encyclopédique).

Désambiguisation

google.com
 Les différents sens d’un mot recherché sont affichés dans la liste de résultats

Résumé du document

Mettre en évidence les termes de la requête dans les résultats (highlight).

Suggestions de corrections orthographiques

google.com
 
Utilisation d’un dictionnaire capable de corriger les erreurs d’orthographies commis par les usagers.

Suggestions de recherches apparentées (term expansion)

Microsoft Live Search
Liste de suggestions related search. Basé sur la session de recherche d’un usager particulier ou sur le comportement d’autres usagers qui ont fait des recherches similaires.

Rétroalimentation

Évaluation de la pertinence des documents retournés par les usagers. Utilisation d’algorithmes pour pondérer les résultats de recherche en fonction de l’appréciation des usagers à des contenus consultés.

Organisation des résultats de recherche

Deux méthodes principales sont proposées pour regrouper les résultats: la catégorisation (en particulier la catégorisaton par facettes) et l’algorithme de groupement (clustering).

La catégorisation est un structure formée par des étiquettes qui expriment des concepts pertinents à un domaine. Elle peut être platte, se consituant d’une liste de thémes ou de sujets; hiérarchique, regroupant des concepts sur un base logique; ou par facettes, regroupant un ensemble de catégories (plattes ou hiérarchiques) qui correspond à une dimension ou un attribut pertinent pour la collection. Une inteface qui présente une forme de navigation par facettes, plattes ou hiérarchiques, doit montrer à l’usager dans quel niveau il peut aller pour raffiner ses résultats mais aussi comment il peut revenir en arrière. Cette approche favorise la recherche exploratoire. L’auteure préconise ce genre de navigation pour organiser les résultats et pour permettre leur raffinement dans les interfaces de recherche :

Usability studies find that users like, and are successful, using faceted navigation, if the interface is designed properly, and that faceted interfaces ar overwhelmingly preferred for collection search and browsing as an alternative to the standard keyword-and-results listing interface (Hearst, 2005, p. 37)

Les algorithmes de groupement permettent de regrouper les documents sur la base d’une mesure de similarité, en analysant la fréquence de termes présents dans leurs contenus. C’est un processus automatique de regroupement qui permet de réveler des caractéristiques intéressants dans des groupes de documents. Les regroupements peuvent être identifiés avec un mot-clé mais cette classification présente souvent des difficultés et des imprécisions en ce qui concerne la cohérence entre les classes. Aussi, les classes qui ressortent des algorithmes de groupement sont souvent vagues et ne permettent pas l’usager de se faire une idée sur le type de contenu de chaque regroupement.

Hearst(2005) discute aussi une tendance majeure dans les interfaces de recherche d’intégrer un module de visualisation permettant de voir entre autres la syntaxe booléenne, les termes de la requête dans les résultats repérés et les relations entre des termes et des documents. Le chapitre offre plusieurs exemples de recherches dans ce domaine et met l’accent sur l’efficacité de ces méthodes pour découvrir la collection de documents et pour inférer des patrons qui ressortent lors d’un processus de recherche.

Conclusion

Le chapitre écrit par Hearst (2005) englobe les principaux enjeux concernant les interfaces de recherche d’information et apporte des notions et des découvertes importantes sur le comportement informationnel dans les moteurs de recherche sur le Web. En effet, ces notions composent le fil conducteur du texte de Hearst, qui voit la recherche en ligne comme un processus plutôt dynamique, composé de plusieurs itérations. Il est très utile d’expliciter que les usagers, de manière générale, n’ont pas une idée précise sur ce qu’ils cherchent et travaillent de façon à tester ce que le système ressorte pour pouvoir ensuite raffiner et explorer les résultats.

Référence bibliographique

Hearst, Marti (2005). «User Interfaces for Search» (chap. 2), dans Modern Information Retrieval. Londres : Addison-Wesley, p. 21–55.

Show your support

Clapping shows how much you appreciated marcelabaiocchi’s story.