[brève] Accord Google/BM de Lyon : l’essentiel

Ceci est un petit résumé du CCTP, à destination des personnes étranges qui ne prendraient aucun plaisir à la lecture des cahiers des charges…

*Généralités
Le contrat porte sur 450 000 à 500 000 ouvrages (= titres ou =volumes ?) sur 10 ans (art.2)
La numérisation doit commencer dans les 18 mois suivant la notification du marché et les 200 000 premiers ouvrages doivent être numérisés dans les 4 ans (art.3)
Elle a lieu dans un lieu secret situé à moins de 50km de Lyon (art.4)

*Traitement de l’opération

*Google ne numérisera pas une partie des pages, elle peut notamment laisser de côté les pages déchirées et les cartes et documents dépliants (art. 14). Sauf si la BML compte effectuer des scans supplémentaires, cela voudrait dire que la consultation de l’exemplaire numérisé ne suffira pas à une personne intéressée et qu’il faudra tout de même parfois recourir à l’original… qu’on nous refusera puisque l’ouvrage aura été numérisé.

*Les documents seront numérisés à la fois en mode image et texte. Problème : il est seulement indiqué que le logiciel d’OCR doit être « performant ». Le flou dans le vocabulaire, alors qu’il est aisé de parler en pourcentage de caractères reconnus, laisse craindre que ce ne soit guère le cas. En tout cas, pour l’instant, les résultats sont très mauvais sur les typographies du XVIIe s. (art.14)

*Les ouvrages ne seront pas absents plus d’un mois de la BML, ce qui limitera leur indisponibilité pour les lecteurs (art.8)

*Les conditions habituelles de conservation devront être respectées et des précautions sont prises lors du transport et de la numérisation elle-même (art.5-7 et 12)

*La BML accepte étrangement que les fichiers ne leurs soient pas forcément donnés en format TIFF. Le JPEG est accepté !

*Les fichiers remis à la BML ne devront pas comporter de filigrane ou de marque de Google

*Google paye 0,64 euros pour création de méta-données bibliographiques dans la limite de 25 000 titres (art. 16). Manière de pallier les éventuelles insuffisances du catalogue de la BML ?

*Un contrôle qualité a lieu mais il n’est pas contraignant : Google ne renumérise que si les deux parties en sont d’accord (art. 18), de même pour la qualité de la mise en ligne.

*Absolument tous les coûts sont à la charge de Google (art. 19)

*Consultation de la bibliothèque numérique

*Google remet à la Ville de Lyon un exemplaire des fichiers créés, accompagnés des métadonnées afférentes.

*La consultation est prévue selon deux modalités (art. 20). D’une part les fichiers seront intégrés à Google Recherche de livres. D’autre part Google propose à la BML une solution clef en main pour la consultation sur internet des ouvrages numérisés. L’entreprise états-unienne décide alors de tout : « Les fonctionnalités, le design et le contenu de ce service hébergé restent entièrement sous le contrôle du titulaire [Google] »
Seule assurance, une recherche avancée est prévue et l’on pourra rechercher à la fois en plein texte et par les métadonnées bibliographiques. Ce portail doit fonctionner 6 mois après le début des opérations de numérisation, donc en 2010.

*Un lien sera établi vers le catalogue de la BML (art. 21)

*Clauses juridiques

*Google a l’exclusivité de la numérisation sur les livres qui lui sont confiés (sauf exception, au cas par cas, dans le cadre des services habituels au lecteur) (art. 24). Il a également l’exclusivité de leur exploitation commerciale pour un temps donné.

*La Ville de Lyon dispose librement des fichiers et des métadonnées attachées, et peut en faire ce qu’elle veut, notamment créer sa propre bibliothèque numérique. Elle peut permettre des téléchargements de pages à l’unité mais doit mettre en oeuvre des solutions pour s’opposer au téléchargement de « parties substantielles » de la base.
Cela pose le problème du statut juridiques des scans. Si des droits existent sur les métadonnées et sur l’ensemble de la bibliothèque en tant que base de données, je ne vois pas de quels droits Google pourrait disposer sur les scans eux-mêmes.

*La Ville de Lyon peut conclure des partenariats à des fins éducatives ou de recherche. Si elle veut coopérer à plus grande échelle, elle doit demander l’accord de Google

12 Responses to “[brève] Accord Google/BM de Lyon : l’essentiel”


  1. 1 Claire H. 28 novembre 2009 à 09:09

    Merci beaucoup pour toutes ces informations. La clause de non-téléchargement des « parties substantielles » d’un ouvrage dans le domaine public me semble ahurissante aussi.
    Une remarque sur la livraison en JPEG : cela prouve que la BmL a conclu un accord pour une numérisation de diffusion, ce que Google sait bien faire, avec évidemment le déchet qu’on sait (rappelé par l’art. sur les cartes dépliantes etc.) et n’a aucune ambition sur le (très) long terme avec ces fichiers. Ce qui rejoint je crois quelques propos entendus de P. Bazin sur la nécessité d’être visible sur le web. Pas forcément de créer une bibnum de référence, comme Gallica (sifflote, sifflote) ou la BIUM, par ex.
    Confirmation pour moi de l’existence de « 2 vitesses » dans la numérisation : celle de consommation et de référence immédiate (chez Google, éq. livre de poche) et celle de conservation et de recherche (chez les institutionnels, éq. hardcover).

  2. 2 rm (l'autre) 29 novembre 2009 à 11:09

    bonjour,

    un peu trop de mauvaise foi à mon goût…
    le TIFF n’est pas le format de conservation universel ; par manque de place, l’acceptation du JPEG comme format de conservation se fait depuis pas mal d’années, avec d’autres fournisseurs. Donc le choix du JPEG ne prouve rien, à mon avis, juste une adaptation aux moyens dont on dispose.

    Où voyez vous que les livres numérisés ne seront plus communicables? C’est une pratique certes courante d’une grande bibliothèque de notre connaissance, qui, depuis le microfilm, a pris l’habitude de ce refus systématique, que l’on observe pas dans d’autres bibliothèques de cette taille et que l’on n’observe pas ailleurs, du moins cette approche systématique. Croyez vous vraiment qu’il soit prévu de fermer la salle du fonds ancien de la BM de Lyon? Moi je ne le crois pas.

    Pour les questions de droit, en particulier sur les métadonnées, la loi française s’appliquera de toutes façons et le CCTp ne saurait s’y substituer.

    L’exception possible pour la numérisation est importante : elle permet j’espère de rénumérisations de qualité pour la recherche ou l’édition, ou la numérisation d’urgence, et la renumérisation lorsque le livre en ligne est illisible (exemple que j’ai vécu à plusieurs reprises avec des livres anciens de la Bayerische Staatsbibliothek sur Google Books, illisibles et inutilisables parfois).

    J’imagine que, comme c’est le cas pour les autres bibliothèques lancées dans la numérisation, pas mal de temps est passé à la BM de Lyon à corriger les notices, en particulier les notices issues de la rétroconversion.

    J’avoue que « parties substantielles » me laisse curieuse : j’imagine que cela veut dire la bibliothèque numérique de la BM de Lyon, si celle-ci en crée une (mais elle n’a pas réussi à le faire depuis tant d’années…), ne doit pas permettre d’aspirer aisément plusieurs livres, par exemple. Car aspirer un livre entier, de toutes façons ce sera possible sur Google Books, la bibliothèque numérique que nous utilisons tous pour rechercher si un livre a été numérisé… je ne crois absolument pas à la chimère du lecteur n’ayant rien à faire d’autre et prêt à interroger l’une après l’autre les bibliothèques numériques de chaque bibliothèque. En tout cas je comprends qu’il peut y avoir trois possibilités au moins d’accès, deux proposées par Google, et une ou plusieurs autres mises en oeuvre par la BM. Cela ouvre la porte à des collaborations et pas mal d’idées me viennent instantanément en tête (portails thématiques en particulier, cheminements au sein des livres numérisés, notices enrichies par des explications et précisions, etc.)

    Je sais, c’est dur, mais il faut véritablement essayer d’observer tout cela la tête froide, de peser le pour et le contre et d’éviter à tout prix la mauvaise foi, dans un sens comme dans l’autre. Voir en particulier quelles sont les autres solutions : solutions techniques et financières mais aussi possibilités réelles de collaboration. Il en existe, mais lesquelles sont à la portée de quelles institutions ? La question principale était : je suis la ville de Lyon, je veux numériser 500 000 ouvrages de la bibliothèque municipale et je veux que le coût reste raisonnable à l’échelle de mon budget. Comment faire?

    Je ne défends pas le choix de Google (et d’ailleurs la non-lecture de certains livres de la BSB, transportés et numérisés pour rien car illisibles, me déprime – heureusement ce n’est pas le cas de tous), j’essaie de comprendre et de rester fermement du point de vue de l’utilisateur, ce qui est évidemment primordial pour le bibliothécaire. J’en profite pour signaler la plus riche bibliothèque numérique française en dehors de Gallica, appuyée sur un grand nombre d’établissements de conservation français et étrangers, e-corpus… à comparer avec les petites bibliothèques numériques de la bibliothèque de truc et de la bibliothèque de machin, avec souvent des modalités de consultation si peu confortables qu’on ne voit pas bien qui peut les utiliser véritablement (sans compter le parcours sportif pour y arriver depuis… depuis où? depuis Google?)

    • 3 ZEMBRAKO 30 novembre 2009 à 21:28

      @RM Merci pour ce résumé,je suis sans doute une de ces personnes qui […ne prendraient aucun plaisir à la lecture des cahiers des charges…].seulement je sont un peux de google-phobie non justifier,vue que malgré la domination de google quasi absolue sur la recherche Web ( plus de 90 % parts de marché en France ) elle reste l’entreprise la plus admirée du monde pour sa structure d’innovation ouverte, à ma connaissance google n’a jamais utiliser son monopole pour brider ou sanctionner ses adversaires commerciale. alore RM « Don’t be evil »
      @rm (l’autre )je trouve ton commentaire très pointu,Une mine de bonnes idées très intéressant.

  3. 4 shaunlemouton 30 novembre 2009 à 10:49

    Ca va faire du bien au débat et chasser un peu les crieurs publics outrés du « pillage » du méchant Google. Pourquoi tous les fonds ne sont-ils pas ainsi numérisés gratuitement, rapidement, avec garantie d’obtenir le fichier numérique de son document…? En résumé la seule contrepartie donnée à Google c’est qu’il peut faire des sous avec le patrimoine de la BM. A part ça Lyon est libre de faire ce qu’il veut de son fonds. Où est le problème???

  4. 5 RM 30 novembre 2009 à 15:36

    @Claire H.
    La question des “parties substantielles” relève de la protection de leur travail, je pense. Comme il ne possèdent pas de droit d’auteur sur les fichiers, le seul moyen de les protéger est de se cacher derrière le droit des bases de données. On peut donc charger un unique livre mais pas un grand nombre car cela serait reproduire leur base de données et tomberait alors sous le coup de la loi. Si un juriste peut confirmer, je suis preneur.

    @rm (l’autre)
    Il n’est bien sûr pas écrit que les ouvrages numérisés ne sont plus communicable mais mon expérience m’incite à craindre que ce soit le cas. Ou que si c’est le cas, il faudra se mettre à genoux et expliquer en 4 exemplaires pourquoi on veut tout de même voir l’original. Mais si la numérisation n’a pas d’effet majeur sur la praticité de la consultation, c’est parfait : ne faisons pas en effet de procès d’intention.

    Je ne sais pas si je donne l’impression d’être de mauvaise foi mais je n’ai absolument rien contre cet accord. J’ai déjà laissé entrevoir à plusieurs reprises ma position sur ce sujet : d’un point de vue éthique, politique, on peut être inquiet du poids de Google mais la seule réponse à apporter est de faire mieux. Et cette réponse dépend des politiques, pas des bibliothécaires. En attendant, d’un point de vue pragmatique pour le lecteur qui cherche un texte et pour la bibliothèque qui doit numériser son fonds avec un budget limité, Google reste une excellente solution.

    @shaunlemouton : idem supra, le problème existe mais à l’échelle de la société, pas de la BM de Lyon. Lyon a conclu un accord très honorable voire très avantageux, avec juste quelques petites scorilles que je me permets de souligner.

  5. 6 Lully 1 décembre 2009 à 08:30

    En fait, je suis surtout étonné par la brièveté du CCTP : 16 pages – ce qui ne retire rien à ton mérite de l’avoir lu en intégralité🙂. 16 pages pour un tel marché, cela laisse rêveur…

  6. 7 Mag DL 7 décembre 2009 à 15:33

    La clause des « parties substantielles » n’est que le corollaire virtuel du principe qui veut qu’on ne photocopie pas plus d’1/3 d’un livre en bibliothèque, principe assez universel je crois ? (en tout cas je l’ai vu à la BSG et à la BnF).
    Pour moi, le seul truc vraiment dérangeant c’est l’idée que Google se fasse du sou sur le patrimoine national, mais je rejoins Rémi : restons pragmatiques, l’accès du public aux ouvrages reste la priorité, si on ne sait pas le faire soi-même, acceptons que Google le fasse pour nous.
    Côté

    • 8 Mag DL 7 décembre 2009 à 15:39

      … fausse manoeuvre, je reprends.
      Côté archives, comme je l’avais déjà signalé je crois, nous avons un « débat » finalement assez proche avec des sociétés privées de généalogie qui exigent (!) que nous leur vendions nos données (déjà en ligne par nos soins) afin qu’ils puissent les mettre à disposition, moyennant finances, des internautes généalogistes amateurs. Eventuellement après les avoir retravaillées/indexées/métadonnéisées. Cela semble plus choquant, à mon sens, que Google et les bibliothèques car il s’agit vraiment de faire du profit directement sur le dos de l’usager lui-même, et non de se faire financer par la pub ; cependant, je suis avide de recueillir vos propres sentiments sur la question.

      • 9 RM 7 décembre 2009 à 16:38

        > Mag DL :

        Non, je ne pense pas : la limitation des photocopies en bibliothèque est réservée aux oeuvres sous droit. Là, il faut se mettre dans la tête que les oeuvres sont *libres* et qu’elles doivent le rester quelle que soit la forme de leur diffusion.

        Revente des données. De deux choses l’une :
        *soit l’entreprise en question a effectué un vrai travail d’indexation etc. et il n’est pas scandaleux qu’elle se fasse rétribuer pour cela.
        *soit ce n’est pas le cas et alors deux sous-cas
        **c’est de l’arnaque pure et simple, cela relève de la justice et un service d’archives n’a pas à intervenir là-dedans
        **soit c’est légal et je ne vois pas le problème.
        Le but de la bibliothèque ou du service d’archives, c’est de diffuser ses données et de faire un travail qui trouve son public. Si des gens préfèrent passer par des sites payants pour obtenir ce qu’ils pourraient avoir gratuitement, c’est leur problème. L’important étant que nous, nous les proposions gratuitement. Et sans exclusivité afin qu’ils disséminent.
        Bref que nous n’essayions pas de reprivatiser des données du domaine public, même au profit de l’Etat.

  7. 10 Antoine Meissonnier 3 février 2010 à 09:59

    Un lien vers une analyse du marché Google/BM Lyon par Archimag qui m’étonne car je n’étais pas arrivé à la même conclusion que l’auteur à la lecture du résumé que tu nous livres, Rémi.
    http://archimag.com/fr/accueil-archimag/magazines/archimag-n231/bm-de-lyon-et-google-les-ediles-lyonnais-oublient-ils-linalienabilite-du-domaine-public.html.

    Qu’en penses-tu ? Il est vrai que, comme tu l’indiques, « La consultation est prévue selon deux modalités (art. 20). D’une part les fichiers seront intégrés à Google Recherche de livres. D’autre part Google propose à la BML une solution clef en main pour la consultation sur internet des ouvrages numérisés. L’entreprise états-unienne décide alors de tout : « Les fonctionnalités, le design et le contenu de ce service hébergé restent entièrement sous le contrôle du titulaire [Google]« ».

    Mais l’accord précise bien : « La Ville de Lyon dispose librement des fichiers et des métadonnées attachées, et peut en faire ce qu’elle veut, notamment créer sa propre bibliothèque numérique. »

    Par ailleurs, le développement d’Archimag sur l’inaliénabilité des reproductions d’oeuvres du domaine public ne relève-t-il pas du pinaillage ? Si Google assure gratuitement la numérisation, il est normal qu’il se rétribue d’une façon ou d’une autre.


  1. 1 Tweets that mention [brève] Accord Google/BM de Lyon : l’essentiel « À la Toison d’or -- Topsy.com Rétrolien sur 28 novembre 2009 à 10:07
  2. 2 VDL le blog Rétrolien sur 4 décembre 2009 à 11:07

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s




novembre 2009
L M M J V S D
« Oct   Déc »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

%d blogueurs aiment cette page :