mardi 27 décembre 2011

Spink et al. (2004). Une étude sur les requêtes internet dans le domaine de la santé

Cette étude a comparé 10 000 requêtes internet, les a comparé avec d'anciennes études pour voir l'évolution des comportements sur internet. Ils ont regardé principalement les requêtes qui commençaient par should. Ils ont trouvé que finalement, actuellement, peu de recherches sont faites sur la santé par rapport aux autres domaines, que quand une recherche est faite, c'est sur principalement 5 sujets (santé générale, problèmes de poids, la santé sexuelle et le développement, l'obstétrique (les femmes enceintes) et les relations sociales). Les recherches médicales se font moins sur des moteurs de recherche généraux et plus sur des sites spécifiques.
Une étude récente a montré que les docteurs commencent à utiliser plus internet par rapport à avant. Il y a donc une meilleure offre de réponse pour les questions des utilisateurs d'internet, cherchant soit des éléments factuels sur des maladies, soit des conseils personnels. Le problème est que souvent, les demandes des utilisateurs sont inadaptées. De nombreuses études ont déjà montrées que les utilisateurs des moteurs de recherche font peu de reformulation, n'utilisent pas les mots scientifiques, font des acronymes, des fautes d'orthographe, etc. (cf. McCray & Tse, 2003 pour exemple). 
Une autre étude s'est intéressée aux centre d'intérêts et aux sujets des différentes demandes qui sont faites sur internet. On y retrouve notamment, entre autres sujets aussi importants : la santé des femmes, le contrôle de son poids, les allergies et les problèmes de dos, etc.
Une enquête a également estimé que 63% des Américains ont déjà recherché une information sur la santé sur un moteur de recherche (ce qui représente quand même 73 million de personnes). Parmi eux, 93% recherchent des informations sur une maladie spécifique, 65% sur des exercices, des conseils pour contrôler son poids et ses formes, 64% pour des médicaments, et 33% pour des questions de problèmes délicats. Plus de la moitié des gens ne recherchent des informations sur la santé via internet que moins d'une fois par mois.

Problèmes de fiabilité dans les contenu (les infos) des sites sur la santé 
Même les étudiants en médecine et les infirmières qui participent à répondre aux questions posées sur internet se sentent incapables de répondre correctement aux demandes. On rajoute à cela que les recherches sur les sites spécialisés, visités par les professionnels, donnent moins souvent de réponses fructueuses à des questions spécifiques que les moteurs de recherche généraux (i.e. google), les sites étant moins faits et incomplets. En conséquence, il y a de moins en moins de recherches sur des sujets médicaux. 
Pour mettre des chiffres sur ce phénomène de diminution des recherches d'informations médicales : les requêtes sur des thèmes médicaux représentaient 9,5% des recherches sur internet en 1997, 7,8% en 1999 et 7,5% en 2001.

Souvent, quand un terme clinique n'est pas connu, l'utilisateur va utiliser son propre langage, approximatif, pour effectuer sa recherche. Il faut donc s'adapter à ce manque du terme pour aider les utilisateurs. Le domaine de la recherche d'information sur les sites de santé ne diffère pas du reste : comme toute autre recherche d'information, on ne fait pas assez de reformulation, on ne regarde que peu de liens en résultat (les 10 à 20 premiers seulement), et on ne s'adapte pas aux caractéristiques d'un moteur de recherche (exemple : utilisation de la recherche booléenne). La différence avec les recherches non-médicales est sur la formulation des questions : on recherche plus d'information sur le comment ou le pourquoi de telle ou telle maladie, que sur des lieux ou des temps.

Catégories recherchées dans les formulaires de recherche de 2 sites sur la santé


Les recherches sur la santé ne représentent actuellement (en 2004) qu'une petite partie des recherches sur internet. Leur part a petit à petit diminuée depuis les années 1997, et devrait ainsi avoir continué à décroitre depuis lors, au profit d'autres recherches notamment centrées sur le commerce, le voyage, l'économie, etc.

On observe un phénomène de mauvaise utilisation des formulaires de recherche, avec des recherches trop courtes, peu de reformulation en cas de non pertinence des résultats, des manques de termes médicaux, etc. Le problème est qu'en plus, nous autres utilisateurs devenons rapidement émotifs face à un formulaire de recherche qui ne nous donne pas les résultats espérés, et on a tendance alors à s'énerver contre la machine, qui a pourtant fait seulement ce qu'on lui a demandé. On s'énerve ainsi contre notre propre incompétence dans l'utilisation des moteurs de recherche.


Source : Spink, A., Yang, Y., Jansen, J., Nykanen, P., Lorence, D. P., Ozmutlu, S. & Ozmutlu, H. C. (2004). A study of medical and health queries to web search engines. Health Information and Libraries Journal, 21, 44–51


lundi 19 décembre 2011

McCray & Tse (2003). Comprendre les recherches infructueuses dans les systèmes de recherche des sites de santé

Souvent quand on recherche une information sur internet, il arrive que nous n’arrivions pas à la trouver. Est-ce dû au fait qu’on se débrouille mal avec l’outil qui nous est proposé, ou est-ce dû à l’outil en lui même ? Rassurez-vous sur votre niveau en informatique, souvent, il s’agit d’un problème du moteur de recherche !
C’est ce que les auteurs ont observés dans un grand nombre de requêtes sur des sites de santé Américains. Le but est de fournir des recommandations pour la construction des systèmes de recherche, particulièrement de santé. Leurs conclusions s’articulent autour du fait que les recherches infructueuses sont souvent dues aux systèmes de recherche limités ou avec des erreurs et au contenu des sites plutôt qu’à un comportement de l’utilisateur, bien que certains problèmes viennent bien d’une mauvaise utilisation du moteur de recherche, ceux ci semblent minimaux.
Pourquoi les requêtes dans les moteurs de recherche amènent parfois à aucune réponse ? On a déjà identifiés quelques problèmes connus : 
  • Erreurs dans la chaine de caractères (exemple : jec herche un einformation)
  • Erreurs de terminologie (exemple : jeux sérieux au lieu de serious game)
  • Taille des mots (les mots courts ne sont pas pris en compte, les mots trop long sont peu utilisés et donc on a moins de chance de les trouver)
  • Sortir du champ (exemple : cherche une information sur une école dans un forum de santé, pour exagérer un peu)
Avec ces erreurs, on a déjà une bonne chance de ne pas avoir les résultats escomptés à notre recherche.
Une autre étude a montré que les recherches ne dépassent pas en moyenne 1,7 mots.

Les erreurs de recherche ont été classifiés dans 4 catégories, dont seulement une est due aux erreurs de formulation des utilisateurs, les autres sont dues au design et à la performance des systèmes de recherche.

Dans les requêtes sur des sites de santé qu’ils ont analysés, les auteurs on trouvé que souvent (une fois sur trois !), alors même que l’utilisateur a bien formulé sa recherche, n’est pas sorti du champ, le système ne trouve aucune réponse, il n’y a tout simplement pas l’information sur le site, qui s’avère donc incomplet, d’où les erreurs.
Les problèmes dus aux utilisateurs sont souvent de plusieurs sortes en même temps (à la fois une mauvaise épellation et une abréviation, par exemple).
Le tableau suivant résume les problèmes dus au contenu (in scope veut dire que la recherche était bien dans le sujet, mais qu’il n’y a pas l’information sur le site ; out of scope veut dire que le site n’est pas suffisamment clair sur les informations qu’il fournit), aux utilisateurs et au système.

Les problèmes des utilisateurs sont : mauvaise épellation des mots, utilisation d’abréviations non reconnues, problèmes dans le découpage des caractères (chaine de caractères), mots tronqués/incomplets, des ellipses de langage, des acronymes et un langage qui ne correspond pas au langage médical. Les problèmes du système sont : non prise en compte des caractères non alpha-numériques, la résolution impossible des problèmes de découpage des caractères (phrases sans espace), la prise en compte des opérateurs (AND, OR, NOT), les mots qui sont pris indépendamment des autres alors que l’ordre importe, la compréhension du langage naturel, une adresse non signifiante, une non prise en compte des langues différentes, les problèmes dans les recherches de références.
Dans ces résultats, on remarque néanmoins que ce qui est marqué comme un problème du système peut être un problème d’utilisateur (exemple : les opérateurs, les mots pris indépendamment des autres (l’utilisateur peut utiliser un opérateur “ ”), les découpages de caractères…)

Pour pallier aux problèmes utilisateurs, il a déjà été proposé d’inclure des propositions alternatives dans les moteurs de recherche, pendant la frappe. Le problème est déjà que les sites étudiés ne proposent des alternatives que dans 2 cas sur 3, et ensuite que les utilisateurs n’utilisent ces alternatives, quand elles sont disponibles, seulement 1 fois sur 2 environ. Il faut également pouvoir développer des systèmes de recherches « intelligents » qui savent transformer les formulations de non spécialistes (problèmes de langage naturel, d’acronymes, etc.) en une proposition qui corresponde à la formulation utilisée sur le site.


Source : McCray, A.T. & Tse, T. (2003). Understanding Search Failures in Consumer Health Information Systems. Symposium proceedings, 1, 430-434