SHIVA : SITES HYPERMEDIAS ET INSPECTION VISUELLE AUTOMATIQUE
Partenaires :
Laboratoire RFV, INSA de Lyon
Laboratoire CLIPS, Université Joseph Fourier de Grenoble
SGBI, Entreprise de Villeurbanne.
Le commerce électronique se développe sur le réseau Internet. Les entreprises et annonceurs ont besoin d’outils pour évaluer leur site Web en vue d’optimiser la pertinence de leurs pages d’annonces. Le projet se propose de contribuer à la réalisation d’outils d’aide à l’évaluation automatique de pages Web en se plaçant du point de vue du lecteur du document et en utilisant des techniques de lecture automatique. Notre contribution se limitera à deux types de pages : la page d’accroche d’un site (sa première page) et des pages d’une banque de données commerciales. Pour la première page d’un site, l’évaluation portera sur (a) la structure du document et (b) sur son contenu. Pour cela on prendra en compte les critères ergonomiques bien connus (pour la structure : lisibilité, équilibre des parties, organisation spatiale, densité, etc. et pour le contenu : "accuracy", "authority", "objectivity", "currency", "coverage"), critères qui peuvent, dans une large mesure, être corrélés avec la trajectoire et les points d’attention du regard du lecteur qui parcourt le document. Pour les pages de la banque de données on ne donnera pas, a priori, de critères d’évaluation ; on en fera choisir deux par les lecteurs ; on les évaluera avec la même méthode que précédemment. Le projet fournira des méthodes et des outils pour l’analyse visuelle automatique de documents en vue d’un diagnostic ergonomique. Les retombées concernent l’ensemble du commerce électronique et plus généralement les annonces sur le Web. Les entreprises et organismes publics ou régionaux tels que les chambres de commerce sont concernés.
Les temps ne sont pas éloignés où l’expression écrite (et son corollaire la lecture) était fondamentalement associée à un support physique unique : le papier. Aujourd’hui un nouveau chantier est apparu, c’est celui de la « dématérialisation » de ces supports papier avec pour objectif d’en extraire et d’en conserver automatiquement l’information pertinente. Cette mise sous forme virtuelle est faite un peu à l’image de ce que fait l’homme, qui par sa capacité à lire et à comprendre, parvient à identifier puis à garder en mémoire une trace de l’information perçue [BON 89].
Comment cette capacité à lire et à comprendre peut-elle être observée et analysée ? Il semble généralement admis [RAY 92] que les mouvements oculaires d’un sujet engagé dans une tâche de lecture, reflètent bien les processus cognitifs à l’œuvre dans cette activité. L’enregistrement des mouvements oculaires fournit une trace spontanée, directe et mesurable de l’attention du sujet en action. En Sciences Humaines, l’étude des mouvements oculaires est souvent utilisée d’une part comme un outil d’observation des témoins d’une activité mentale ou d’un fonctionnement spatial, et d’autre part comme un moyen de vérification des modèles comportementaux. Dans l’étude de l’activité de lecture, par exemple, l’analyse de l’emplacement, du nombre et de la durée des fixations oculaires, de l’amplitude des saccades et des variations de la direction du regard, sont autant d’indices des opérations mentales de traitement des informations visuelles qui se déroulent, d’une façon automatique ou contrôlée. Depuis l’"eye-mind hypothesis", émise en 1980 par M. Just et P. Carpenter [JUS 80] , l’observation des mouvements oculaires s’est affinée, et a permis, par exemple, de mettre en lumière une stratégie globale de déplacement du regard vers une position optimale, en fonction d’indices uniquement visuels, et des tactiques locales de réajustement en fonction d’interprétations plus élaborées de données visuelles et linguistiques. C’est la théorie dite "stratégie et tactiques", proposée par le groupe Regard de l’Université Paris V [O’R 90].
par un aspect temporel, le temps de fixation sur les différentes parties du texte, le temps de lecture total,
par un aspect spatial : taille des empans, localisation des points de fixation,
par un aspect stratégique : nombre des fixations, retours arrière.
Ces caractéristiques dépendent en grande partie du type de texte lu. Si l’on connaît le type de texte proposé, ce qui est généralement le cas dans la lecture de pages Web, alors la trajectoire oculaire apporte des indications sur la façon dont le sujet en construit le sens. Par exemple, un temps de fixation très long sur une même zone du texte, une fréquence élevée des retours arrière , ou une réduction de la taille des empans indiqueront des difficultés de construction du sens. Ces difficultés peuvent provenir 1) du lexique utilisé : termes insuffisamment définis, ou ambigus, etc., 2) de la construction syntaxique, par exemple référents difficilement identifiables, enchâssement de relatives, 3) des marques énonciatives : insuffisance de ponctuation, de connecteurs, etc., ou encore 4) de l’expression elle-même : manque de cohérence dans l’enchaînement des énoncés, information manquante, etc. L’analyse des mouvements oculaires de sujets engagés dans une recherche sur le Web va donc permettre d’évaluer, au delà de leur propre style cognitif dans cette tâche, le degré de difficulté d’interprétation présenté par la tâche elle-même.
Les documents électroniques sont des objets structurés, qui ont un contenu. Celui-ci est souvent multimédia c’est-à-dire textuel et imagé (figures, tableaux, images, croquis, etc.) et la présentation est hiérarchisée (titres, sous-titres, blocs de texte, paragraphes, etc.). Lorsqu’on lit un document on opère à plusieurs niveaux (perception, compréhension, interprétation) en utilisant des stratégies diverses : dans un premier temps on peut effectuer un survol pendant lequel la structure du document est perçue, certains titres ou figures étant globalement analysés, puis dans un second temps une lecture fine de certaines parties jugées pertinentes est mise en œuvre. Ces deux phases peuvent d’ailleurs interférer de manière itérative ou imbriquée. En retour, dans le cadre de l’évaluation d’un document, on peut être tenté d’utiliser les informations portées par la trajectoire du regard d’une manière diagnostique : repérer les points de focalisation, les zones d’intérêt qui peuvent donner de précieux renseignements sur la structure du document, suivre les points de fixation et leur densité, les points de reprises, etc., qui peuvent permettre de mesurer l’efficacité de l’acte de lecture pour améliorer la qualité de rédaction.
Lire la suite...