Posts Tagged 'Gallica'

On ne saurait mieux dire…

Réaction de mon ami Antoine Du Verdier à propos de la réutilisation des données publiques et des bibliothèques qui entravent la diffusion des scans issus de la numérisation des exemplaires qu’elles conservent :

« Si faut-il que je blasme la vaine ambition d’aucuns d’entre eux, qui pensans garder leurs librairies en plus d’estime sans en permettre autre cognoissance que de l’ouir dire, ne voulurent onques souffrir qu’elles fussent communiquées à plusieurs, dont advint que ce leur zele indiscret apporta par laps de temps l’enneantissement de leurs livres qui servirent de pasture à vers et en fin d’aliment au feu, en lieu de bonne et solide nourriture aux subtils esprits humains qui ne vivent que de la substance immortelle des sciences. »

La bibliothèque d’Antoine Du Verdier, seigneur de Vauprivas. Contenant le catalogue de tous ceux qui ont escrit, ou traduict en françois, et autres dialectes de ce royaume…, Lyon : Barthelemy Honorat, 1585, préface, p. XIV.

Mission Tessier : derrière la question Google/Gallica

La mission Tessier a remis ce mardi 12 janvier son rapport au ministre de la Culture. Ses conclusions ne sont pas d’une grande originalité et viennent bien plutôt préciser les rapports de force politiques actuels sur la position à adopter vis-à-vis de Google et de Gallica.

Cela est certes très intéressant et j’espère faire le point dans un prochain billet.

Mais je crois que ce rapport est également important en ce qu’il participe du tournant qui est en train d’être pris dans les bibliothèques, en faveur des partenariats et de la dissémination des données.

Le rapport affiche rapidement la nécessité de prendre comme point de départ les pratiques réelles des internautes (p. 8), y compris en prenant en compte ces réseaux sociaux (p. 9) que certains battent froids ou considèrent comme peu sérieux.

C’est-à-dire que, contrairement à des pratiques encore trop répandues, on n’attende pas que le public daigne venir sur notre site (inconnu et mal fagotté) mais qu’on lui donne une véritable visibilité par de réelles actions.

Ceci pose donc la question de la place du patrimoine écrit sur Internet (p. 22) :

Il conviendra donc de veiller à ne pas numériser pour numériser, mais d’assurer l’accès à ces fonds numérisés, ce qui implique de réfléchir très en amont à la façon dont les documents pourront être trouvés, c’est-à-dire visibles, sur l’internet. Une réflexion approfondie sur l’ensemble des moyens permettant cette visibilité numérique (référencement, indexation, citations dans des blogs ou des sites communautaires, etc.) devra donc être engagée

Cela devra passer par un travail sur les outils qui existent actuellement. L’amélioration de l’ergonomie, de l’"utilisabilité" de Gallica est nécessaire, par "de nouvelles fonctionnalités, davantage orientées vers les aspects participatifs et communautaires", pour qu’on puisse s’y balader et pas seulement aller chercher le livre dont on a besoin, en en frémissant d’avance. L’amélioration du moteur de recherche interne de Gallica (prévu) également : un de mes grands plaisirs, en bibliothèque, est de voir des employés vérifier que le livre que je demande n’est pas disponible sur Gallica [on ne va tout de même pas me le donner si un autre exemplaire est numérisé... des fois que je l'abîme]. Ils entrent alors "Andilly" dans la recherche auteur et trouve… rien. Il fallait taper "d’Andilly", sinon la recherche échoue. Sic.

Mais cela passera aussi par des pratiques qui se mettent actuellement lentement en place : l’acceptation que l’expertise sur les documents se trouve plus chez les milliers de lecteurs que chez les quelques bibliothécaires et, partant, la nécessité de permettre aux premiers d’enrichir description et organisation des documents.
L’auteur de ces lignes ayant eu l’honneur de négocier au nom de Wikimédia France (dont il est membre du CA ; en collaboration avec Alexandre Moatti) un accord avec la BnF, il vous en parlera bientôt.

Il est enfin nécessaire d’aller vers une mise à disposition la plus grande possible. Il convient pour cela de régler quelques difficultés juridiques comme celle des oeuvres orphelines (p. 12) mais dans le but d’une plus grande diffusion de ces oeuvres et non pour reprivatiser – cette fois-ci au profit de l’Etat – ce qui était libre auparavant. Il est agréable de voir que les membres de la mission pensent ainsi en termes d’"usages légitimes". Cela est piquant car on retrouve la notion états-unienne de fair use qui manque tant au droit français. On lit ainsi que ce ne serait pas forcément une mauvaise chose que de passer outre le droit des bases de données (derrière lequel se cache notamment la BnF pour protéger son coûteux travail de numérisation) pour permettre, selon les cas, le téléchargement systématique (p. 16).

Bref, conséquence de l’immixtion du politique dans les problématiques patrimoniales, la question de l’utilité sociale (et donc de l’utilisation) des fonds patrimoniaux des bibliothèques se retrouve sur le devant de la scène : les professionnels seront donc appelés à modifier leurs pratiques afin de s’adapter à celles d’un public à conquérir, ce qui peut être d’une très grande fécondité pour peu que les questions soient réellement posées (en dehors des a prioris idéologiques).

Ce rapport – ainsi que celui de l’été dernier sur la diffusion des oeuvres culturelles publiques – vont dans le sens d’un renouvellement des pratiques des professionnels du patrimoine écrit que j’appelle de mes voeux depuis quelques temps déjà, ce qui me réjouit…

***

Et puisque tout le monde semble soudainement passionné par le livre ancien : je vous livre un scoop. Vous voyez l’édition que Pierre Le Petit a donnée en 1671 des Confessions de Saint-Augustin dans la traduction de d’Andilly ? Eh bien, il n’y en a pas une mais deux.

Veut-on vraiment numériser ?

J’ai lu cette semaine un amusant et intéressant article. Il proposait de ne plus donner l’équivalent des grands chiffres en années de smic mais en équivalent de pages numérisées par la BnF.

On trouve généralement un coût de 25 à 74 centimes par page pour la numérisation de Gallica. L’auteur de cet article faisait donc remarquer que la fameuse douche que le président Sarkozy a fait installer au Grand Palais lors de la présidence française de l’UE (245 000 euros) aurait permis de numériser près d’un million de pages, soit à 500 pages par exemplaire (je compte large) 2000 ouvrages.

Ceci est bien affligeant mais demeure anecdotique au regard du budget de l’Etat.

Sans préjuger en rien de leur intérêt pour le bien de la société et du pays – je laisse à plus savant que moi sur ces matières le soin d’en juger – le bouclier fiscal coûte plus de 13 milliards d’euros par an, l’allègement de la fiscalité des plus-values plus de 20 milliards sur deux ans.

Reprenons donc nos équivalents-page-Gallica. Et tant qu’à parler en milliards d’euros, jouons le grand seigneur, partons du principe que Gallica veut se démarquer de Google par l’excellence de sa numérisation, à 1 euro la page.
*bouclier fiscal : 13 milliards de pages soit (500 pages par ouvrage [comptons large, vous dis-je]) 26 millions d’ouvrages ;
*fiscalité des plus-values : 20 milliards de pages soit 40 millions d’ouvrages

On arrive à des chiffres qui ne sont plus tellement parlant tant ils sont grands. Que représentent donc ces 26 millions de livres que l’on peut numériser chaque année en supprimant le bouclier fiscal ? Ni plus ni moins que deux fois l’ensemble des collections de la BnF.
Un plan quadriennal utilisant ces deux seules ressouces permet de numériser 130 millions de livres de 500 pages c’est à dire sans doute plus que d’éditions existant au monde. Il y a du rab’ pour trouver des accords avec les éditeurs d’oeuvres encore sous droits.

La question n’est donc pas de savoir s’il y a de l’argent. De l’argent, l’Etat en a, même en période de vache maigre : la numérisation ne coûte rien par rapport à d’autres dépenses. Il s’agit bien plutôt de placer les questions de numérisation dans l’ordre des priorités de l’Etat.

Et cela, ce n’est pas tant le travail des bibliothécaires que des politiques. Mais c’est aussi le devoir des citoyens de choisir ses représentants en fonction des choix qu’ils auront faits.

"Donnez-moi le bouclier fiscal et je numérise le monde" comme ne l’a pas dit Archimède.

MàJ : Mise au régime de ma "vache aigre" pour en faire une "vache maigre". Merci à Les Martiens pour le signalement de la coquille.
MàJ (bis) : Lien vers l’article (au début) que je ne retrouvais pas. Merci à Lully de me l’avoir redonné.

Bibliothèques numériques : et l’usager ?

On va encore dire que je suis méchant ou sarcastique mais je viens d’écouter – avec un peu de retard, c’est l’avantage de l’écoute à la carte – l’émission Question d’éthique, retransmise le lundi sur France Culture.

L’émission portant sur le thème "Une bibliothèque universelle numérique, à quel prix ?", la présentatrice, Monique Canto-Sperber, y recevait Michel Bernard, professeur à Paris III, et – ô surprise et originalité de nos médias – Jean-Noël Jeanneney.

La présence de M. Jeanneney, dont personne ne connaît les thèses, a été rafraîchissante et sa pensée a dû étonner plus d’un auditeur.

Les personnes intéressées auront sans aucun doute peu appris mais l’émission a au moins eu l’intérêt de mettre les choses au clair en orientant la discussion autour des quelques grandes problématiques. Surtout, elle a permis de mettre en valeur une figure centrale mais un peu oubliée dans les débats politiques actuels : l’usager.

Car dans cette émission, les rôles étaient (involontairement, pour partie) bien distribués : Michel Bernard (MB) jouait le rôle de la personne raisonnable connaissant les dangers de Google mais reconnaissant ses avantages en tant que lecteur. C’est lui qui m’a intéressé.
Face à lui, des personnes dont la partition était déjà écrite et qui permettaient donc de mettre le premier en valeur : Jean-Noël Jeanneney (JNJ), nuancé et intelligent, mais revenant toujours à ses vieilles lunes et justifiant son action en tant que président de la BnF ; et Monique Canto-Sperber (MCS), enfin, jouant le rôle de la caricature de Jeanneney (c’est à dire du Jeanneney vu par une certaine presse qui n’a pas lu son livre). Il faut avouer que c’est reposant : pas de surprise dans ce que vont dire les intervenants, tout se déroule comme au théâtre.
Finalement, le plus drôle était au début, quand on s’est rendu compte que, pour une émission sur l’éthique, la présentatrice invitait un autre producteur de France Culture, qui lui-même ne semblait pas choqué par ces petits arrangements entre amis. Peut-être suis-je le seul choqué de ces pratiques. Je suis resté naïf et crois à la vertu. La preuve, je suis fonctionnaire.

*Egalité d’accès contre fracture numérique

MB, spécialiste de l’usage de l’informatique dans la recherche littéraire, souligne l’importance des bibliothèques numériques pour l’accès au savoir. Sans aller jusqu’aux pays du Sud, comme il l’a fait, rappelons qu’il est impossible à un provincial de rédiger une thèse sans venir à plusieurs reprises à Paris, ce qui coûte fort cher.

La thèse opposée a été développée avec une radicalité rare, ce qui l’a rendue plus plaisante que convaincante. Avec la meilleure foi du monde, MCS, voulant parler de la facticité de cette mise à disposition pour un public qui n’en a pas l’usage et du risque de "fracture numérique", a réutilisé les arguments du XIXe siècle sur les risques de la lecture de romans pour le peuple et les femmes. Parlant d’abord des dangers de l’"accès sans formation préalable", elle a craint que "tout le monde [puisse] être en contact avec le contenu de savoirs hérités qui parvenaient [auparavant] à des personnes qui s’étaient préparées à cela". Avant de conclure par une question essentielle "Ne voyez-vous pas une forme de danger pour la culture universelle ?"

JNJ s’est heureusement employé à recoller les morceaux avec son concept central (et qui doit nous faire peur !) : le vrac. Il a alors souligné qu’il fallait par dessus tout former les gens (dès l’école) à utiliser ces nouveaux outils pour n’être pas enseveli sous ces masses d’information, ce qui est de bon sens.

*Ranger en piles ou chercher dans le tas

Pour éviter le vrac, JNJ veut une information sous la forme d’une arborescence (et non tout sur le même plan) et une validation des contenus.

On est alors tenté d’aller voir dans Europeana ce qu’il en est. Je tape quelque chose qui me donnera beaucoup de résultats – au hasard "Louis XIV" – et je restreins aux textes. Sur les 12 résultats de la première page, qu’obtiens-je ? 8 études variées publiées au XIXe siècles (et donc largement obsolètes), une "declaration du roy contre les corsaires" de 1691 (document d’époque, mais anecdotique), et trois autres documents du même intérêt.
C’est peut-être une vieille technique de beaucoup parler pour éviter que l’on aille voir les réalisations mais il ne me semble pas que le classement d’Europeana soit plus significatif ou utile au béotien que celui de Google. Et j’ai beau pouvoir raffiner ma recherche par un système de facettes, cela ne me sera pas d’une grande aide pour sélectionner les ressources les plus pertinentes (surtout quand les années de parution ne sont pas rangées par ordre chronologie (sic)).

MCS prend alors l’exemple (canonique, j’ignore pourquoi) du tremblement de terre de Lisbonne et explique que si l’on cherche des renseignements sur ce dernier dans Google Livres, on obtiendra "tout un tas de publications où il sera peut-être beaucoup plus question du tremblement de terre de Lisbonne mais qui n’en diront rien de véritablement intéressant. Comment celui qui est peu informé, qui n’a pas conduit une sorte de préparation intellectuelle est-il en mesure de traiter tout ce savoir ?" MB souligne à juste titre que le problème est le même dans une bibliothèque où mettre l’usager devant le rayon qui l’intéresse ne suffit pas : dans les deux cas, il faut savoir chercher puis traiter l’information. Ajoutons qu’il existe une méthodologie de la recherche et qu’on va généralement chercher des ressources généralistes avant de chercher des choses plus spécialisées. Je citerais bien l’article de Wikipédia, qui est très correct et donne des références bibliographiques pour aller plus loin, mais je sais que JNJ n’aime guère Wikipédia.

Mais allons plus loin et comparons les résultats de Gallica, Europeana et Google Livres avec "tremblement terre Lisbonne"
*Google : les deux premiers résultats (en affichage limité) sont Les tremblements de terre aux XVIIe et XVIIIe siècles: la naissance d’un risque‎, très bon essai universitaire publié chez Champ Vallon ; et Le tremblement de terre de Lisbonne chez Odile Jacob, monographie de référence sur cet épisode, longuement analysé.
*Europeana (restreint aux textes) : un article du Guardian sur le refus du Danemark de ratifier le traité de Maastricht (sic) puis des ouvrages des XVIIIe et XIXe siècles sur des séismes à Messine et en Amérique méridionale et à Lesbos (re-sic, le dernier ouvrage n’est pas vraiment documentaire…).
*Gallica : Le guide de voyage "Petit fûté" sur Lisbonne suivi de Les catastrophes célèbres, Mame, 1861.

Là encore, on voit apparaître une contradiction. Cela signifierait qu’on pourrait être intellectuellement d’accord avec JNJ et, pour cette raison même, plutôt utiliser Google Livre que Gallica ? Hmm, voilà qui ne cadre guère avec ce qu’on lit dans les journaux où on répète les arguments de chaque camp sans jamais, apparemment, utiliser les outils dont on parle…

*Une sélection rigoureuse ou tout numériser ?

JNJ et MCS mettent en avant le choix raisonné supposé être celui de la BnF, contrairement à Google qui numérise n’importe quoi.

Là encore, des nuances doivent être apportées. Du côté de la BnF puisque le rapport de l’Inspection des finances dont j’ai récemment parlé contestait les [non-]choix effectués. Du côté de Google également puisqu’il numérisent par bibliothèques entières. Affirmer que leur choix n’est pas pertinent, c’est affirmer que le fonds de la Bodleian n’est pas cohérent, ce qui n’a pas vraiment de sens.

Le choix effectué, il faut hiérarchiser l’information. JNJ conteste les choix de Google, selon lui fondés sur la recherche de l’audimat. Il donne alors l’exemple de Stendhal, convaincu de n’être lu et compris qu’en 1936 et affirme que Google l’aurait mal classé [sous-entendu : "quelle bande d'idiots, il est pourtant évident que Stendhal est un grand écrivain"].

À ce moment comme à d’autre, on a la désagréable impression que JNJ parle de classement des ouvrages dans le vide, comme si ce classement ne dépendait pas d’une recherche effectuée par un lecteur. Après, ce qu’il dit de Stendhal est probablement vrai, mais j’incline à penser que la BnF de 1880 aurait également proposé Georges Ohnet ou Emile Augier avant le Grenoblois. D’ailleurs, le simple fait d’avoir été assez clairvoyant pour récupérer ses archives suffit à sauver la mémoire de l’illustre Hyacinthe Gariel. Mais le fait même qu’il pose la question en ces termes amène à s’interroger sur les idées de JNJ en matière de hiérarchie de l’information : le rang doit-il dépendre de la qualité de l’oeuvre ? Selons quels critères ? Déterminés par qui ?

*L’impérialisme culturel américain

La discussion roule alors sur la diversité culturelle et notamment des langues utilisées. JNJ revient sur les exemples donnés dans son livre sur les poésies de Victor Hugo disponibles uniquement en traduction anglaise et sur la vision tronquée car anglaise de la Révolution française. Outre qu’il précise que ces défauts qui existaient au début du projet ont été largement corrigés depuis, MB souligne le paradoxe qu’il y a à se plaindre que la culture française ne soit pas assez présente dans Google livres tout en faisant pression pour éviter que les fonds des bibliothèques françaises y soient intégrés.

*Oeuvres sous droit, oeuvres orphelines

Même si nous sortons des questions patrimoniales, cette partie de la discussion est révélatrice de la vision de chacun des interlocuteurs.
MCS parle de "l’orgueil" de Google et de la désinvolture avec laquelle il s’est placé en dehors du droit d’auteur : elle parle du point de vue de l’éditeur avec comme valeur première le respect du droit d’auteur. MB acquiesce mais fait remarquer que la désinvolture existe également chez les "éditeurs vis-à-vis de cette masse de textes sur lesquels il ont posé un veto, qui n’est plus accessible parce qu’ils ne veulent plus la publier, parce qu’ils sont supposés n’être plus suffisamment rentables, dont les auteurs eux-mêmes ne peuvent rien faire car ils ont passé des accords avec les éditeurs". C’est à dire qu’il parle du point de vue du lecteur, avec comme valeur première la diffusion et l’accès au savoir. Et il souligne que si Google est en effet une entreprise commerciale qui cherche le profit, c’est également le cas des éditeurs français, qui acceptent de rendre inaccessibles des ouvrages dont ils détiennent les droits en ne prenant en compte que leurs intérêts propres et non ceux du public.

La position de MB est intéressante car elle est très rarement prise en compte alors qu’elle est centrale. Il convient de la plupart des critiques faites à Google, des risques de monopole, etc. Mais il est chercheur et il a juste besoin de livres.
Intellectuellement, il est d’accord avec JNJ mais, en tant qu’usager, il doit être pragmatique. "Comme consommateur, je préfèrerais utiliser Quaero mais Google est meilleur", dit-il.
Or, dans la plupart des médias, la question n’est abordée que d’un point de vue éthique, politique, stratégique… en oubliant que ces sites sont avant tout des outils pour des gens qui cherchent des livres. Et qu’il arrive un moment où, même si on craint la menace que représente Google, on ira sur Google Livres parce que le livre dont on a besoin est sur Google Livre.

Seule solution pour sortir de cette aporie : que l’Europe y mette les moyens. Tout le monde a souligné le faible budget consacré à la numérisation en France, alors que les enjeux sont gigantesques pour des dizaines d’années. Le budget annuel est inférieur au prix d’un unique avion Rafale… Eh oui.

Des modèles de bibliothèques numériques ?

Lisant Quel modèle de bibliothèque, récemment sorti aux presses de l’Enssib, je me demandais dans quelle mesure cette notion de modèle de bibliothèque, souvent appliqué à la lecture publique, pouvait être pertinente pour les bibliothèques numériques.

Expliquons. Traditionnellement (et schématiquement), on oppose une bibliothèque savante, issue de la tradition catholique où le savoir est médiatisé, contrôlé. De l’autre une bibliothèque de la tradition protestante, où la lecture personnelle est encouragée, où la bibliothèque est ouverte à tous et a une approche pratique des choses. C’est très schématique mais il est en tout cas irréfutable que la relation à l’écrit n’est pas la même dans le monde anglo-saxon et dans le monde latin.

Pour les bibliothèques (publiques) physiques, le modèle anglo-saxon (ou plutôt, l’image que les Français se faisaient du modèle anglo-saxon) a fini par triompher avec la bibliothèque moderne, la médiathèque. Les longues lignées de tables de travail ont disparu au profit d’espaces conviviaux, on accède au livre directement, l’accent est mis sur la presse, l’actualité, les supports audio-visuels.

Je me demande dans quelle mesure cela n’est pas applicable aux bibliothèques numériques.

*D’une part, le style Gallica : avec des livres choisis et validés par des bibliothécaires, rangés au sein de corpus construits. Une offre médiatisée dans laquelle le bibliothécaire cherche à guider le lecteur et lui expliquer ce qui est intéressant ;
*D’autre part, le modèle Google Books, où tout est donné en vrac, à charge pour le lecteur d’être intelligent et curieux et de faire son miel de la quantité offerte.

Chacun des deux modèles se justifie et cela peut finalement recouvrir des publics dont les demandes diffèrent.

Là où on peut être critique, c’est que le modèle Gallica a tendance à nous ramener à un modèle "littéraire", voire romantique, de la connaissance. Alors même que l’on s’intéresse de plus en plus – et cela depuis un certain temps – à l’ensemble de la production écrite d’une époque et que la notion de "chef d’oeuvre" semble un peu datée, une telle sélection la remet sur le tapis. Cela est peut-être nécessaire dans un premier temps afin que le néophyte ne se perde pas dans la masse – mais c’est lui faire peu confiance : ne vaudrait-il mieux pas le former ?

C’est surtout introduire la notion de "grand", d’"important", bref des jugements moraux là où l’écriture est avant tout une activité sociale et le reflet d’une société. Décider de donner une édition plutôt qu’une autre, c’est statuer qu’il est des "bonnes" et des "mauvaises" éditions, certaines qui font référence et d’autres pas. Certes. Mais à choisir la "bonne" édition, on cache la tradition d’un texte. Pire, on fait croire que ce texte est immuable, sans donner à voir ses avatars, sans faire comprendre qu’un texte est lu et donc présenté de manière différente aux diverses époques. Pire encore, on laisse accroire qu’un livre est uniquement un texte alors qu’il est bien plus que cela.

Dans tous les cas, il semble relativement peu probable que les deux modèles demeurent – sauf au sein de niches pour un public restreint. Et la survie darwinienne ne dépend pas seulement du modèle mis en place mais surtout de la facilité d’accès et des liens avec d’autres pages. Et, là, Google a un avantage indéniable, voire inquiétant.

Retour sur "Quand Google défie l’Europe" de J.-N. Jeanneney

On voyait des regards en coin depuis quelques temps, des oeillades – c’est à peine s’ils ne s’attendaient pas à la sortie du collège – on se disait qu’il y avait anguille sous roche et qu’ils viendraient bientôt nous avouer, rubescents et gloussants, ce dont nous nous doutions largement. Ce n’est pas encore fait mais un camarade a cafté dans l’entretemps.
Le camarade La Tribune a donc annoncé le 18 août, repris par la plupart des médias du monde, qu’un accord était sur le point d’être signé entre la BnF et Google pour la numérisation de son fonds.

Ceci est sans doute à replacer dans le contexte du prochain verdict du procès intenté à Google, dont le délibéré aura sans doute des conséquences gigantesques sur l’avenir de la diffusion de la connaissance et les modèles économiques qui seront mis en oeuvre à l’avenir. Pour les lecteurs, on peut espérer que cela permettra de débloquer le problème des livres épuisés encore soumis aux droits d’auteur – cette zone grise "protégée" par des éditeurs qui préfèrent voir mourir leur fonds plutôt que le mettre gratuitement à disposition et qui n’ont toujours pas compris grand chose aux enjeux et au fonctionnement d’internet.

Mais surtout, cela marque un retournement de politique comme on en voit rarement. Certes, M. Jeanneney est passé de président de la BnF à doubleur de François Mauriac sur France Culture (si, si : écoutez, vers 7h45…) mais alors, la politique menée était-elle un caprice du prince et non issue d’une analyse raisonnée des enjeux et des possibilités de l’établissement ? Va-t-on entendre dans la foulée B. Kouchner affirmer que D. de Villepin n’était qu’un Cyrano de pacotille et envoyer les troupes françaises remplacer les Britanniques en Iraq ? Charles Bremmer, correspondant du Times à Paris s’en donne à coeur joie, bien entendu. Pierre Assouline se permet de se montrer acide : "Il aura donc fallu quatre ans pour que la Bnf passe de la résistance à la collaboration." Et sur internet, surtout en ce moment, quatre ans, c’est une éternité. Mais qu’est-ce que sont quatre ans de perdu, par rapport à la joie de montrer son… panache et sa flamme à tout le monde et de se poser en dernier défenseur de la civilisation occidentale ? Bon, la question est sans doute plus complexe et je ne voudrais pas paraître ironique ni m’agréger aux personnes qui crient haro sur le baudet en profitant de leurs quatre années de recul pour reprocher ses choix à l’ancien président.

Bien au contraire, cet accord annoncé – dont il ne sert à rien de parler pour l’instant puisque nous n’en savons rien – est l’occasion de relire le pamphlet/essai dudit président. Ca tombe bien, il trône en bonne place dans ma bibliothèque personnelle, acheté avec ton argent, ô contribuable mon frère, sur les maigres deniers alloués par l’Etat aux chartistes méritants, dans une librarie indépendante du boulevard Saint-Michel.
A posteriori, le titre peut sembler un peu ironique : "Quand Google défie l’Europe"… l’Europe échoue et finit par plier. Que dire alors du glorieux sous-tire "plaidoyer pour un sursaut" : soit le plaidoyer n’a pas été entendu, soit le sursaut n’a pas été l’envol escompté. Que trouvons-nous cependant dans ces 150 pages ?

Un certain nombre de questionnements, qui ne sont pas aussi caricaturaux que ce qu’on veut bien faire croire aujourd’hui.

D’abord, M. Jeanneney convient de l’intérêt de l’entreprise et des mérites de l’action de Google: "je n’en éprouvai ni chagrin ni irritation mais un choc stimulant" (p.10). Les pages sur les dangers de laisser des entreprises d’une telle importance aux mains d’intérêts privés, sur les dangers de la publicité et le risque de biais qu’elle implique dans l’affichage des résultats, sont certes une tarte à la crème (avec force citations du Général…) mais à laquelle on ne peut qu’adhérer.

A posteriori, je ne sais s’il s’agit d’une erreur de perspective de l’auteur ou d’un changement dans la politique (ou les possibilités techniques) de Google mais une partie des craintes se révèle étrangement vaine. Jeanneney part sur l’idée d’un Google fixiste, qui décide par lui-même et de manière irraisonnée ce qu’il propose. Cela n’est pas faux et les algorithmes de Google font certainement partie des secrets les mieux gardés au monde. Mais, d’une part, d’un point de vue technique, Google va vers une pertinence de plus en plus grande dans ses sélections : il n’est qu’à voir la différence entre la version actuelle et celle qui se prépare. D’autre part, c’est faire abstraction de la prise en compte de plus en plus grande de l’usager et de la possibilité de personnaliser les outils. Les résultats donnés par Google sont une base, dont je peux faire bien des choses – supprimer un résultat, modifier l’ordre, etc. Dans GBS, j’ai la possibilité de me constituer une bibliothèque personnelle, dans laquelle je peux ensuite effectuer des recherches. Google me propose un ordre mais également des outils pour me constituer mon propre ordre.
Il est en revanche fondamental en effet que les utilisateurs sachent effectuer une recherche d’information. Qu’ils ne se contentent pas d’une recherche dans GBS – pour répondre à une question complexe, il faut consulter divers outils et s’intéresser à la bibliographie de la question – et soient capables d’évaluer la pertinence des documents trouvés.
On se demande alors dans quelle mesure M. Jeanneney a pris conscience des modifications du système d’information (voire de pensée) depuis l’apparition d’Internet. La bibliothèque n’a plus le même sens depuis que le web a fait son apparition et que Google existe, c’est un fait. Il ne faut pas considérer Web = chaos = mal. Mais il faut en revanche convenir que la notion de savoir évolue : il est possible (on aura la réponse dans quelques dizaines d’années) que le savoir comme ordonnancement du monde ait fait son temps et qu’il faille désormais penser en terme de réseau et d’interaction, avec un usager beaucoup plus actif qu’autrefois. Ce ne serait pas le premier changement de paradigme dans le monde du savoir depuis 2000 ans et c’est précisément ce qui rend passionnant l’histoire des bibliothèques, du livre et des pratiques intellectuelles. Ainsi quand on parle du "vrac, danger absolu" (p.121), on se pose des questions. Les méthodes changent, on parle maintenant d’indexation communautaire, de folksonomie et d’autres techniques qui n’existaient pas il y a 15 ans (et que Gallica a d’ailleurs intégrées) mais on s’y retrouve.

Quant à la crainte que Google ne propose que des ouvrages anglophones ou proposant une vision anglo-saxonne du monde, on a envie de répondre à l’auteur que cela ne dépend précisément que de l’action des bibliothèques françaises : si leur fonds est numérisé, il sera disponible dans GBS et viendra donner un contre-poids salutaire au monoculturalisme. La nécessité de ce contre-poids est d’ailleurs pour partie contestable dans la mesure où dans le monde académique – l’auteur donne l’exemple de la Révolution française où chez les Anglais les aristocrates sont beaux et valeureux tandis que les Jacobins sont des méchants assoiffés de sang ; qu’on me permette d’en douter – est largement internationalisé. Bien plus, comme l’a montré Robert Damien, une bibliothèque, qu’elle soit de brique et de mortier ou numérique, consiste précisément à faire dialoguer les livres et les points de vue : les livres sont l’exact contraire du livre. Si telle différence il y avait entre les appréhensions anglo-saxonnes et françaises des choses, GBS serait une excellente chose car chacun nuancerait son approche. La question de l’approche française, européenne, anglo-saxonne ou comtoise des choses peut justement être dépassée par de tels outils et par Internet dans son ensemble : bien souvent on ne sait même plus dans quelle langue on y a lu un article et dès qu’on se spécialise un peu dans un domaine (que ce soit le patrimoine écrit, les nouvelles technologies, le droit ou la politique) on se situe dans un alter-monde où les nationalités et les langues comptent peu. Pour tout vous dire, sur Facebook, je ne reçois pas des "demandes d’amis" mais des "vriendschapsverzoek" et mon Google me parle latin…

En revanche, si M. Jeanneney veut contrer la vision purement américaine du monde et faire feu de tout bois pour imposer la présence française, j’ai bien des idées à lui proposer. Si l’on voulait vraiment opposer une réponse forte à la présence culturelle américaine là où elle constitue un abus, un vrai travail sur le droit d’auteur ne serait pas inutile. D’abord, il faudrait éviter de freiner/empêcher la diffusion des photos des fonds des bibliothèques françaises : qu’une institution tente de gagner trois sous en vendant ses photos ou en tentant de faire croire qu’elle a des droits sur ces photos, c’est compréhensible dans le contexte actuel. Mais l’Etat doit comprendre que c’est une bien faible ressource comparé à la visibilité que le refus de placer ces photos sous licence libre lui fait perdre et au final un mauvais calcul. De même, c’est un abus et une erreur politique que les seules photos librement réutilisables de De Gaulle ou de Mitterrand soient des photos prises par la Maison Blanche. Pourquoi ? Parce que les photos prises par des agents fédéraux sont librement réutilisables alors que l’on considère en France que ce serait un crime vis-à-vis de l’Art que de refuser ses droits moraux et patrimoniaux sur ses "oeuvres" à un fonctionnaire photographiant dans le cadre de ses fonctions. Résultat : la vision américaine se diffuse et les photos libres de réalités purement françaises sont fournies par la présidence américaine ou la NASA. Quand aux "artistes" français, personne ne verra jamais leurs photos mais, au moins, l’honneur est sauf et leur statut reconnu…

Au final, au-delà des questions éthiques déjà mentionnées (privé, publicité, etc.), la numérisation par Google pose à mon humble avis trois questions
1/ la qualité de la numérisation – jusqu’ici assez mauvaise pour des raisons de coût. Va-t-on vers deux numérisations successives, une pour aller vite et une seconde pour raffiner ensuite ?
2/ des questions juridiques : qui est propriétaire des fichiers ? que la BnF pourra-t-elle en faire ? que les lecteurs pourront-ils en faire ? (avec la menace juridiquement très légère mais pourtant courante que les bibliothèques/numériseurs tentent de faire croire qu’ils ont des droits d’auteurs sur les fichiers ainsi produits)
3/ des questions techniques de pérennité des données (une des priorités et un point fort de la BnF)

J’imagine que c’est sur ces questions que la BnF négocie et c’est sur les réponses apportées que l’accord sera considéré comme bon ou pas.

Dans tous les cas, la relecture de ce petit ouvrage (ma dernière lecture datait de novembre 2006… pour préparer le concours de l’enssib) n’a pas été inintéressante. Elle fait mesurer combien les évolutions sont rapides et demandent une grande réactivité. En cinq ans, des outils extraordinaires (que ce soit Gallica/Europeana ou GBS) ont été mis en place pour le plus grand bénéfice des lecteurs – combien de livres ai-je laborieusement recopiés à la BnF alors qu’ils sont désormais en ligne et accessibles de partout ! C’est un changement dont on a sans doute du mal à mesurer tous les effets mais qui constitue une rupture dans l’histoire des pratiques intellectuelles. Il faut cependant garder à l’esprit que la numérisation reste une technique : ce n’est pas parce que les Stances pour Jésus-Christ (Paris, Edme Martin, 1628 ; il n’en existe a priori qu’une seule émission… mais je cherche encore) sont mises en ligne que le monde entier se ruera pour les lire. Les institutions/entreprises qui décident d’entreprendre ce gigantesque travail ont donc des buts différents.
La numérisation de Google est une première étape mais elle ne constitue pas la panacée. Dans le domaine du patrimoine écrit, une numérisation intégrale des imprimés anciens n’est pas hors de portée (mais, encore une fois, encore faudrait-il en avoir une description fiable…). Pour les livres plus récents, deux solutions se présentent : ou une adaptation des éditeurs ou de nouvelles pratiques de publication (et de validation scientifique) ne passant plus par des éditeurs commerciaux (archive ouverte etc.). Sans cela, par un charmant paradoxe, certains types d’ouvrages récents risquent de subir de plein fouet la concurrence des livres anciens : on voit déjà des historiens citer une mauvaise édition de texte trouvée sur Gallica ou GBS au lieu de l’édition de référence, uniquement disponible sur papier. C’est une faute de leur part, certes. Mais aussi de la part des bibliothèques/éditeurs.

MàJ : Une réaction de Jeanneney (à l’accord de la BnF, pas à ce billet) est annoncée pour demain dans le Figaro. Peu de suspense sur ce qu’il dira, mais cela indique que la question prend de l’ampleur et qu’on ne devrait pas tarder à voir arriver les politiques.


mai 2013
L Ma Me J V S D
« avr    
 12345
6789101112
13141516171819
20212223242526
2728293031  

Suivre

Recevez les nouvelles publications par mail.

Joignez-vous à 58 followers