vendredi 17 février 2012

De l'accessibilité des sources…

Un peu plus d'un mois après la publication de mon billet sur la Wikibétisation partielle, je me décide enfin à en publier la suite promise.

Comme je le soulignais, seul l'usage de la balise <ref></ref> est vraiment essentiel pour rédiger un texte encyclopédique. Elle permet une double vérifiabilité : celle de l'énoncé (qui n'a pas été inventé pour l'occasion mais provient apparemment d'une source préexistante) et celle de la valeur-même de la référence (une notice bibliographique de type « Jean Bidasse, Mémoire d'un concierge sur les bruits qui courent en ville, Dinard, 1851 » ne sera pas forcément autant appréciée que « Julius Krasnoïark, Analyse exégétique de la valeur-marchande dans l'œuvre de Karl Marx, CNRS éditions, Paris, 2011 »). Elle fonde la légitimité de Wikipédia, son crédit auprès de dizaines de millions de lecteurs.

Par comparaison, le reste est important mais pas primordial. La wikification, les catégories, les subdivisions peuvent être présentes ou pas, sans nuire à la crédibilité de l'article (évidemment, il n'en va pas de même en terme de facilité de lecture). Il paraît de fait envisageable de contribuer sans y recourir, sans assimiler entièrement la syntaxe wiki ; des contributeurs confirmés se chargeant ensuite de corriger et nettoyer le texte brut ainsi produit.

Le problème qui se pose ici tient à la sociologie des « contributeurs potentiels ». Deux expertises facilitent éminemment l'intégration dans la communauté : l'expertise informatique (familiarité préalable à la syntaxe wiki) et l'expertise universitaire (familiarité préalable aux règles de la rédaction encyclopédique). L'une et l'autre peuvent suffire individuellement. La connaissance du code permet déjà de se livrer à des modifications de forme (travail de wikifourmi, patrouille etc.) qui, par une pratique répétée, entraînent une accoutumance progressive aux exigences du travail collaboratif. La connaissance de l'écriture scientifique permet, via une wikibétisation partielle, de concevoir des articles « bruts » ; ce faisant, on peut acquérir par strates successives les principales balises et fonctions.


Schéma sociologique de la population wikipédienne


Le code et l'écriture scientifique constituent ainsi deux portes d'entrées qui autorisent, à terme et si tout se passe bien, un accès intégral. Mais qu'en est-il lorsqu'aucune des portes ne s'ouvre complètement ? Quid de l'amateur désintéressé, qui voudrait simplement apporter sa petite pierre à l'édifice ? Il peut sans doute s'intégrer sous trois conditions : être motivé, motivé et motivé, ce qui, on le conçoit bien, prend du temps et de l'énergie. Ici se situe probablement l'une des explications du déclin relatif des contributeurs, constaté dans la plupart des wikipédia (mais pas ou peu dans la francophone) : la population visée est assez limitée (disons pour faire large qu'elle regroupe surtout une certaine élite intellectuelle à laquelle on peut adjoindre une minorité de passionnés, prêt à franchir tous les obstacles pour rejoindre l'une des grandes aventures du moment) ; l'amateurisme est découragé (pour être sûr que son travail sera accepté / apprécié, il n'y a pas vraiment d'autres solutions que de contribuer régulièrement).

Tout ceci me laisse à penser que l'encyclopédie se doit d'élargir ses missions et compétences . Il ne s'agit plus seulement d'offrir une information fiable au lecteur, mais d'initier les contributeurs potentiels voire (soyons fous) l'ensemble du lectorat à la fabrique de cette information.

La faculté de discrimination des sources n'est pas très difficile à acquérir. Pour le résumer très grossièrement, plusieurs éléments entrent en ligne de compte : la date de première publication (cela dépend des disciplines, mais, globalement, dans les sciences humaines sont jugées acceptables tous les articles et ouvrages publiés il y a moins de 30-40 ans) ; le statut de l'auteur et sa notoriété (c'est probablement le plus difficile à établir : à moins d'avoir un descriptif précis dans le texte, la meilleure solution consiste à le googliser et voir ce qui en ressort) ; le statut de la maison d'édition et/ou de la collection (de préférence scientifique ou généraliste) ; l'apparence-même du texte (même s'il remplit toutes les conditions antérieures, un texte sans références est plutôt louche).

Evidemment, cette faculté de discrimination est sévèrement entravée dès lors que les textes ne sont pas facilement accessible. Seul un contributeur régulier va emprunter une source adaptée en bibliothèque (voire en faire l'acquisition). Les autres font avec ce qu'ils ont chez eux, ou ne font rien du tout.

C'est un problème sérieux. La légitimité d'un contributeur dépend étroitement de la qualité de ses sources : plus elles sont médiocres, plus il aura de mal à défendre ses postures éditoriales et plus son activité sera découragée. Les contributeurs confirmés et/ou ceux qui possèdent une formation universitaire avancée disposent d'un avantage décisif contre les autres : ils savent comment accéder aux bons textes.

Wikipédia ne peut pas grand chose contre cette inégalité a priori. La réponse vient d'ailleurs : les sources de qualité deviennent de plus en plus accessibles sur Internet. La fonction aperçu de Google permet déjà d'accéder à de larges fragments d'un ouvrage donné. Et puis, surtout, la publication libre différée des revues scientifiques tend à devenir la norme. En France, chercheurs et étudiants pratiquent couramment Persée ou Cairn depuis déjà quelque temps. Enfin, certains auteurs mettent individuellement en ligne leurs thèses ou d'autres études scientifiques qui dormaient jusqu'alors dans quelque obscure recoin de bibliothèque.

Cette dynamique d'accessibilité connaît toutefois quelques ratés. Il y a deux semaines, le blog Matières vivantes donnait un inquiétant compte-rendu des basses manœuvres des éditeurs de revues scientifiques américaines. Leurs lobbyistes tentent ainsi d'abattre une loi de 2008 qui mettait en open access la plupart des articles en biologie et médecine. Les chercheurs sont apparemment les premiers à s'opposer à cette re-privatisation : ils ne gagnent quasiment rien avec leurs articles ; leur diffusion sur Internet contribue à élargir leur notoriété par-delà les cercles scientifiques (c'est ce qu'on appelle, dans le jargon interne, de la valorisation).

Raté ou pas, on se retrouve quand même avec un beau corpus de sources de qualité, dont seul une faible partie est effectivement exploitée sur Wikipédia. Pour cette raison, je me demande si on ne devrait pas organiser des recensements systématiques des bonnes références en ligne. Cela pourrait se faire au niveau des articles — à défaut d'améliorer une ébauche, on pourrait proposer une sorte de kit clé en main pour faciliter le travail du contributeur qui souhaitera s'y coller. Cela pourrait aussi se faire au niveau des portails — des pages d'aides listerait les ressources de référence dans un domaine concerné, et donneraient quelques indications générales sur leur utilisation.

Concrètement, ces « recensements » amélioreraient probablement l'intégration des nouveaux contributeurs. Ceux-ci disposeraient rapidement des sources considérées comme les plus légitimes. Leur lecture et leur décorticage posera sans doute quelques difficultés même si dans l'ensemble, la plupart des articles et études de science humaines et sociales sont compréhensibles pour quiconque a une bonne base de culture générale. Mes propres travaux universitaires ont tendance à être interdisciplinaires : je n'ai jamais eu véritablement de difficulté à reprendre et à croiser des données venues de la musicologie, de l'économie, de l'histoire, des sciences politiques ou de la sociologie.

En outre, ces « recensements » s'inscriraient dans une grande tendance de fond de l'encyclopédie en ligne, en faveur de la collecte et de la computation de données. En avril, la Fondation Wikimédia va ainsi lancer le projet Wikidata qui sera effectif d'ici un ou deux ans. J'aurais très prochainement l'occasion d'en reparler.

5 commentaires:

Dr Brains a dit…

Il me semble que le problème de l'accessibilité des sources va bien au delà de Wikipédia. Une "bonne" source, c'est à dire vérifiable facilement, est une source

* en ligne

* non payante (et je rajouterait : ne demandant pas d'enregistrement/identification/etc...)

A partir de ce constat, l'effort à faire est justement au niveau de ceux qui détiennent ces sources, c'est à dire en premier lieu les bibliothèques et musées, afin de numériser leurs ouvrages, mais aussi les plateforme de publication scientifique, qui doivent être d'accès libre.

Force est de constater que le premier point, le plus important, est loin d'être idéal, et que les institutions (surtout publiques et surtout françaises(!pov!)) traînent les pieds. Le droit d'auteur, dans sa conception rigide finalement peu adapté aux nouveaux usages numériques, ne facilitant évidement pas les choses.

Anonyme a dit…

Je crois que cette une bonne idée mais la mise en place est difficile. à mon sens cela ne doit ni se faire au niveau des articles car trop source de conflit, ni des portails mais au niveau global. Par ailleurs, il faudra faire attention de bien dire d'où parlent alors ces blogs ou ses sources de façon à dire tel courant X source X' avance cette idée ou cette analyse. Pour tel autre courant Y l'analyse est au contraire ....

Cela dit pour écrire un commentaire non anonyme si on n'a pas un compte google 'est difficile chez vous

Anonyme a dit…

Vu les fautes d'orthographe finalement c'est mieux d'être anonyme

Anonyme a dit…

Peut-être que je suis trop centralisateur et que les portails pourraient être le niveau pertinent. Mais je crois néanmoins qu'il devrait d'abord y avoir une réflexion au niveau global même si les décisions concrètes pourraient se faire au niveau des portails

Alexander Doria a dit…

@Dr Brains : oui, c'est clair que la situation actuelle est encore loin d'être idéale. Perso, je rêve du jour où l'on pourra mettre directement en regard le texte encyclopédique et le texte de sa source (la vérifiabilité sera maximale). C'est vrai que les institutions publiques françaises traînent des pieds (dans mon université, ça fait cinq ans qu'on parle de numériser les thèses et les mémoires, sans qu'il n'y ait rien qui en sorte). Par contre, au niveau des revues, je trouve qu'on dispose quand même d'une bonne matière — j'ai pu écrire plus d'un bon article avec l'aide de l'ami Persée.

@Anonyme : ça me paraîtrait envisageable de faire une page de pédagogie générale pour les débutants et les contributeurs intermittents, où l'on détaillerait le processus de discrimination des sources, et où l'on indiquerait les principaux hébergeurs de sources de qualité. Pour le reste, les portails/projets me paraissent assez appropriés : ils cernent un champ précis du savoir et c'est le lieu où la collaboration encyclopédique est la plus efficace (à l'échelle communautaire il y a trop d'interférences). Et sinon, oui, blogger est assez contraignant. Généralement, les wikipédiens concernés par le problème signent la fin du message de leur pseudo (c'est un peu du bricolage, mais c'est mieux que rien)