Audit et étude technique numérisation Offres de numérisation patrimoniale Numérisation sur site client
Contexte
Par l’intermédiaire de sa filiale BnF-Partenariats, la BnF lançait en 2016 RetroNews qui réunit aujourd’hui sur une plateforme en ligne plus de 2 000 titres de presse publiés entre 1631 et 1952. Accessible sur abonnement, RetroNews est à la fois un espace digital de recherche et de consultation d’archives et un média pour tous donnant à découvrir l’histoire par les archives de presse. En s’associant à des éditeurs contemporains tels queLibération, La Dépêche du Midi, La Voix du Nord,Les Inrockuptibles ou encore Historia,BnF-Partenariats entend enrichir son offre multi-titres sur la seconde moitié du XXe siècle, destinée au marché académique tout en mettant à disposition des éditeurs une nouvelle plateforme de valorisation et de monétisation de leurs propres archives.
Enjeux
L’un des enjeux majeurs du projet de numérisation, étape indispensable de tout type de site internet, a été de pouvoir mener en parallèle la numérisation de collections pour partie sur le site des quotidiens et pour d’autres titres dans les locaux d’Arkhênum.
La volumétrie à considérer (7,4 millions de pages) a nécessité la mise en place d’un processus de production industriel mais évolutif en fonction de la nature des collections.
Cette flexibilité dans la production est dictée par l’hétérogénéité des documents :
Différentes typologies de presse (PQR, hebdomadaire, …)
Différents formats de documents (tabloïds, broadsheet, …)
Niveau de conservation variable des documents
Un audit nécessaire
Définir le contour du projet
Avant de se lancer, unaudit des collectionss’est avéré nécessaire pourcomprendre le périmètre du projet et les enjeux à adresser.
Laurent Bidet, expert en numérisation chez Arkhênum, a durant un mois réalisé un tour de France des collections pour en dresser un état des lieux précis :
Constat d’état des documents et validation des métriques (ml, …)
Validation des bornes chronologiques concernées
Analyse de la structure des collections (évolution de la maquette, nombre de colonnes, …)
Faisabilité d’une numérisation in situ pour les titres concernés
Le rapport d’audit a pu mettre en lumière des alertes et surtout servir de base de travail pouranticiper et mettre en place le projet de numérisation. Durant cette phase, certaines collections ont été identifiées comme non numérisables (texte coupé et courbure, reliures et fascicules encartés, …) rendant la numérisation impossible. Le recours à d’autres dépositaires des collections (Archives départementales, …) a été organisé.
17 titres numérisés
7,4 millions de pages à numériser et traiter
Pas moins de 17 titres sont concernés par ce projet de numérisation depuis lesquotidiens régionaux(Le Télégramme,La Provence, la Dépêche du Midi, la Manche Libre, Midi Olympique, …) jusqu’auxhebdomadaires et revues spécialisées nationales(Paris Match, l’Express, Charlie Hebdo, l’Histoire, Historiaou encoreles Inrockuptibles).
Durant les 3 années du projet, 1 directeur de projet, 2 chefs de projet et 12 opérateurs vont assurer au sein d’Arkhênum le pilotage, la production et le contrôle des images numériques.
Un projet de numérisation inédit
De par l’organisation souhaitée par les diverses parties au projet, 4 sites de production autonomes ont été installés au sein des entités dépositaires des titres : Morlaix (Le Télégramme), Toulouse (La Dépêche du Midi), Saint Lô (La Manche Libre) et Marseille (La Provence). Arkhênum a déployé sur chaque site son savoir-faire technique (installation d’ateliers de numérisation autonomes) et humain (recrutement en local et formation des opérateurs sur site). La numérisation des autres titres s’effectue dans les locaux permanents d’Arkhênum. Pour garantir une homogénéité parfaite des images numériques générées, un protocole très strict de numérisation a été établi avec la BnF : calibration, cadrage, colorimétrie, … La Direction de production chez Arkhênum dédiée à ce projet, en la personne de Sigrid Haro, est en charge de garantir cette homogénéité ainsi que le bon déroulé de l’activité sur l’ensemble des ateliers.
TÉMOIGNAGE
« Nous avons trouvé chez Arkhênum un partenaire qui a su prendre la mesure de l’ampleur de ce projet industriel. »
Yoann Gantch Directeur adjoint & business development BnF-Partenariats
L’outil de suivi de production interne Numesis a été adapté pour pouvoir suivre spécifiquement ce projet notamment sur la phase de contrôle qualité. Suite à la validation des lots, un traitement poussé des images au travers de la segmentation d’articles, de la reconnaissance de caractères (OCR) et d’enrichissement sémantique seront réalisés pour permettre ensuite lors de la consultation en ligne de proposer une recherche optimale.
Contrôle qualité et métadonnées
De la numérisation à la préservation et à la valorisation commerciale des archives de presse
Les archives des éditeurs de presse seront versées au fur et à mesure à la BnF qui en assurera la conservation dans son service de préservation pérenne (SPAR) et la valorisation auprès de son public de chercheurs dans ses salles de lecture via Gallica intra-muros. Dans le même temps, une plateforme de service développée par BnF-Partenariats, permettra la consultation de ces millions de pages de presse, constituant ainsi une nouvelle source extrêmement riche d’information et de documentation pour de nombreux publics. Les éditeurs associés à BnF-Partenariats pourront ainsi enrichir leurs offres d’abonnement et élaborer des produits documentaires basés sur leurs archives inexploitées à ce jour. Pour BnF-Partenariats, cela ouvre la possibilité de proposer des licences de consultation sur tout ou partie du fonds à des tiers, comme des écoles, des universités, des centres de recherches, … Mise en production fin 2023, la plateforme sera accessible pour ses premiers clients dès 2024 selon des offres et modalités adaptées à toutes les typologies d’éditeurs. Les éditeurs de presse associés au projet font partie des premiers clients de la plateforme. Contact commercial BnF-P : Yoann Gantch
Offres de numérisation patrimoniale Numérisation sur site client
Contexte
L’histoire de la Bibliothèque nationale allemande débute en 1912 avec la création de l’une des institutions précurseurs, la Deutsche Bücherei ou Bibliothèque allemande, à Leipzig. Avec la division de l’Allemagne après la Seconde Guerre mondiale, est créé son pendant à l’ouest, la Deutsche Bibliothek, à Francfort-sur-le-Main en 1947. En 1990, les deux institutions sont réunies dans le cadre de la réunification de l’Allemagne. Les sites de Leipzig et de Francfort-sur-le-Main sont cependant maintenus.En 2006, l’institution prend le nom de « Deutsche Nationalbibliothek » (DNB) ou Bibliothèque nationale allemande.
Enjeux
Dans le cadre de ses missions de préservation, la Bibliothèque nationale d’Allemagne avait jusqu’alors mené des opérations de numérisation sur des fonds ciblés.
En 2021, l’institution décide de numériser de manière plus systématique et large ses collections. A cet effet, elle lance un appel d’offres dans le cadre duquel Arkhênum est retenu pour 24 mois avec une tranche conditionnelle de 24 mois supplémentaires.
Depuis Septembre 2021, les équipes d’Arkhênum numérisent dans les locaux de l’établissement des documents imprimés présentant une variété de formats, états de conservation et langues d’écriture.
3.4 millions de pages à numériser
Copyright : Bibliothèque nationale d’Allemagne, Stephan Jockel
Doter la DNB d’une collection numérique
La Bibliothèque Nationale allemande, à travers son programme ambitieux de numérisation de collections, vise à préserver avant tout la pérennité physique de ses documents. Cette démarche va aussi contribuer à enrichir le portail numérique des collections qui est un des axes forts de son développement. Si le cadre juridique des droits d’auteur le permet, il est possible d’accéder aux versions numériques des documents au sein des salles de lecture ou dans le monde entier. Les images numériques des ouvrages imprimés ont bénéficié d’un traitement de reconnaissance optique des caractères (OCR) pour optimiser une future recherche plein texte. Cette version numérique est mise à la disposition de la DNB dans un format de consultation pérenne. Ce projet constitue ainsi un élément important de la stratégie à long terme de l’établissement.
La « Bücherturm »
Les 24 000 documents concernés par cette campagne de numérisation sont stockés dans la « Bücherturm » ou Tour des livres de l’institution à Leipzig.
Les documents sont extraits tour à tour de leur rayonnage pour être numérisés dans l’atelier Arkhênum déployé dans les locaux de la bibliothèque. Les documents sont ensuite replacés à leur emplacement d’origine.
Copyright : Bibliothèque nationale d’Allemagne, Anne-Katrin Mettke
Un projet réalisé dans l’enceinte de la DNB
Une phase de test de 3 mois
Etant donné l’ampleur du projet et son caractère stratégique, une phase de test spécifique a été mise en place. Celle-ci a porté sur la numérisation de 200 ouvrages représentant environ 38 000 vues. A l’issue de ce test, et suite à la validation par la DNB des paramètres de numérisation ainsi que des métadonnées générées, le projet a pu entrer dans sa phase de production.
Pour ce projet d’envergure, Arkhênum a également su apporter une solution sur-mesure pour le contrôle qualité en permettant aux équipes de la DNB sur les sites de Leipzig et de Francfort de valider à distance les images avec la possibilité de déposer des commentaires. La mise en place de ce processus dédié a été définie en collaboration avec les équipes de la DNB.
Un atelier de numérisation autonome
Le savoir-faire d’Arkhênum en matière de numérisation sur site a permis d’installer en un temps record un atelier de numérisation complet et autonome au sein de l’institution à Leipzig.
Ce sont pas moins de 7 personnes qui sont déployées à temps plein sur site. «Avec notre équipe de 6 spécialistes de la numérisation, nous sommes confiants dans le fait que nous atteindrons les objectifs tant qualitatifs que quantitatifs dans les délais impartis. » confie Robert Günther, le chef de projet Arkhênum sur place.
Une grande hétérogénéité de documents
Les collections à traiter allant de 1913 à nos jours, les équipes d’Arkhênum sont amenées à manipuler des documents de format, état de conservation et langues différents.
Cette hétérogénéité se retrouve tout d’abord dans les formats mais également dans l’état des ouvrages. Une partie d’entre eux doivent être numérisés en ouverture restreinte afin de ne pas endommager davantage la reliure. Ces documents sont principalement en langue allemande mais sont pour la majorité imprimés en typographie dite « Fraktur » désignant le gothique allemand. Cette spécificité nécessite un traitement de reconnaissance de caractère particulier maitrisé par Arkhênum.
Offres de numérisation patrimoniale Valorisation Web Numérisation sur site client
Contexte
L’Institut National d’Histoire de l’Art (INHA) a été créé en 2001 sous la forme d’un établissement public sous la tutelle conjointe des ministres chargés de l’enseignement supérieur, de la recherche et de la culture. L’Institut a pour mission de développer l’activité scientifique et de contribuer à la coopération scientifique internationale dans le domaine de l’histoire de l’art et du patrimoine.
Dans cette optique de diffusion des connaissances, la Bibliothèque de l’INHA-collections Jacques Doucet propose à la consultation, dans la salle Ovale du quadrilatère Richelieu à Paris, 1,4 million de documents de tous types.
Enjeux
C’est pour promouvoir ces fonds exceptionnels, mais aussi pour en faciliter la consultation et la conservation que la Bibliothèque de l’INHA s’est lancée dès 2002 dans la numérisation, et a mis en service une bibliothèque numérique en 2006.
Pour alimenter cettebibliothèque numérique, d’importants programmes de numérisation sont en cours (plusieurs centaines de recueils d’ornements, plusieurs milliers de catalogues de ventes d’oeuvres d’art, …).
C’est pourquoi une interface permettant une gestion simple de la mise en ligne et, pour les internautes, une recherche efficace et une consultation agréable, est indispensable.
L’INHA choisit Arkhênum pour mettre en avant ses collections
Bibliothèque numérique de l’INHA
L’Histoire de l’art à portée de clic
« Dès 2002-2003, nous avons mis en place un programme de numérisation de nos fonds. Nous avons sélectionné les documents à numériser en fonction de plusieurs critères et notamment leur intérêt pour la recherche en histoire de l’art et archéologie ainsi que leur rareté.Seule une petite partie de ces fonds a été numérisée pour le moment (922 245 images consultables en ligne, soit 27 334 documents environ). »
Expositions virtuelles
Cette fonctionnalité permet de mettre en avant visuellement une thématique donnée. Ainsi, chaque mois l’équipe de la bibliothèque valorise les dernières collections numérisées.
Bientôt 1 million d’images disponibles
Un enrichissement en continu des collections
Les campagnes de numérisation régulières depuis 2003 et leur mise en ligne en continu fidélisent les internautes. 35,84% des visiteurs reviennent sur le site de la bibliothèque numérique de l’Institut National de l’Histoire de l’Art. Elle n’a cessé de voir son trafic augmenter. 500 visiteurs s’y rendent en moyenne chaque jour et y restent plus de 4 minutes.
Grâce à l’efficacité du back-office de la bibliothèque numérique, l’INHA peut continuer à alimenter régulièrement et en toute autonomie sabibliothèque numérique.
Poursuite des campagnes de numérisation
Arkhênum numérise régulièrement dans ses ateliers ou au sein de l’établissement des collections de l’INHA : livres et estampes, autographes, dessins, photographies…
Les dernières fonctionnalités de partage
Le choix de Limb Gallery pour la bibliothèque numérique de l’INHA s’explique par les nombreusesfonctionnalités de visualisation et de consultationoffertes par cette solution. La fluidité du zoom et la possibilité de consulter et télécharger les imprimés en modes image et texte sont particulièrement plébiscités par les utilisateurs.
Par-delà l’aspect visuel, c’est la puissance de la solution (moteur de recherche avec auto-complétion et prévisualisation des résultats, facettes, murs d’images 3D, géo-référencement …) et les développements constants dont elle fait l’objet qui ont séduit l’INHA.
Offres de numérisation patrimoniale Valorisation Web Numérisation sur site client
Contexte
La société Sfate & Combier est depuis 1850 l’un des fournisseurs de tissus de référence pour le marché de la Haute couture, des créateurs et du Prêt à Porter
haut de gamme.
Le savoir-faire et la modernité de la société sont aux cœurs des préoccupations de la direction. C’est à ce titre qu’elle a souhaité lancer un projet ambitieux visant à mettre à disposition pour ses différents collaborateurs en temps réel et 24h/24, 7j/7 l’ensemble des créations de la société.
Grâce à cette politique ambitieuse, Sfate & Combier souhaite se doter d’une base de données fédérée qui permettrait aux collaborateurs de gagner du temps et donc d’être plus efficaces.
Enjeux
Le lancement de l’outil avec une première partie des archive, était souhaité pour février 2019 lors du salon Première Vision à Paris, l’événement incontournable des matières et services à destination de la mode mondiale.
Avant d’en arriver là, différentes étapes ont été nécessaires dont la caractérisation des collections et l’établissement d’un thésaurus qui ont nécessité des profils d’intervenants complémentaires.
Cette préparation des collections a permis de dresser chez le client avec les tissus en main l’inventaire précis au format excel des échantillons sélectionnés pour la numérisation.
Capitaliser sur la richesse de sa création
Caractériser les archives textiles avant de les numériser
Les archives textiles de la société recensent tout l’historique de créativité de la société depuis ses origines.
Ce savoir-faire n’avait pas encore été décrit sur support numérique pour permettre une recherche en base. La préparation des échantillons de tissus préalable à la numérisation a été réalisée par Sandrine Bachelier, une consultante spécialiste du textile.
L’opération de numérisation a ensuite été réalisée par Arkhênum dans les locaux de Sfate & Combier pour garantir une disponibilité à tout moment des documents. C’est donc un atelier complet de numérisation de documents grands formats qui est déployé.
Les archives, sources d’inspiration ou de réinterprétation
L’entreprise possède plusieurs milliers d’archives textiles et papier du XVIIIe siècle à nos jours. Ces archives servent de base d’inspiration (tant matière que motif) pour les clients et les stylistes de l’entreprise.
1 000 nouvelles créations chaque année
Une base de données métier dans une simple tablette tactile
La réussite du projet va aussi dépendre de la bonne définition de l’usage de l’outil et des attentes utilisateurs.
L’équipe logicielle Arkhênum dans le cadre de son audit a identifié les différentes typologies d’utilisateurs, leurs attentes et les usages futurs pour dimensionner l’outil à mettre en place.
L’adhésion à cet outil de travail passait aussi par l’intégration d’un thésaurus métier défini par la consultante et validé avec les futurs utilisateurs. Preuve de cette adéquation au besoin et de sa prise en main intuitive, le témoignage d’un commercial qui atteste que « C’est comme si on faisait des courses sur Internet en mettant nos choixdans un panier».
Un outil conçu sur mesure
Les archives et collections sont maintenant référencées et accessibles en version numérique pour être mises à disposition des équipes et des clients. En externe, la force commerciale est en capacité de répondre encore plus rapidement à ses clients et ainsi se démarquer de la concurrence.
Un outil de travail collaboratif et évolutif
Suite au lancement de l’outil, les résultats sont là : gain de temps au quotidien pour les différents collaborateurs, échanges d’informations avec le partage d’images et/ou descriptif du tissu et enfin la préservation des originaux dont la manipulation, toujours nécessaire, est limitée.
L’autre intérêt de la solution est que les collaborateurs de Sfate & Combier peuvent administrer et enrichir en toute autonomie l’outil. La base de données est amenée à s’enrichir d’année en année de nouveaux contenus avec 1 000 nouvelles créations de tissus par an et par les archives plus anciennes, notamment les albums d’échantillons, venant enrichir l’offre et le savoir-faire de la société.
Institut Africain de Développement Economique et de Planification (IDEP)
Expertises en oeuvre
Offres de numérisation patrimoniale Numérisation sur site client
Contexte
L’Institut Africain de Développement Economique et de Planification (IDEP) est une institution panafricaine. Créée par l’Assemblée Générale des Nations Unies en 1962, son siège est situé à Dakar (Sénégal).
Son mandat principal est d’accompagner et d’aider les pays africains à renforcer les capacités de leurs équipes dirigeantes afin de garantir la viabilité de l’indépendance et la promotion du développement socio-économique de l’Afrique.
Ses réserves sont riches de plus de 1,5 km linéaire de documents archivés depuis 1963 sur l’histoire économique de l’Afrique post-indépendante.
Enjeux
La bibliothèque de l’IDEP à Dakar est l’unique centre dépositaire des documents de l’Institut. Cette concentration des exemplaires papiers uniques au regard des 54 pays africains adhérents pose bien sûr des problématiques d’usage et d’accès à cette connaissance unique sur ce continent.
D’autre part, la pérennité des documents est remise en cause du fait de l’usure inexorable du temps mais aussi de la manipulation régulière de ces 6 000 documents. Conscient de ces enjeux et défis pour le futur de l’IDEP, l’Institut lance une consultation afin de dématérialiser ses archives. Arkhênum est retenu pour réaliser la prestation dans les locaux de l’établissement.
Un projet en 2 étapes indissociables
Les archives de l’IDEP à Dakar (Sénégal)
Une étape d’audit nécessaire
Avant de démarrer tout projet de préservation numérique de ces documents uniques, l’IDEP a dû circonscrire l’étendue du besoin. Une étape préparatoire avait déjà permis d’identifier quantitativement mais aussi qualitativement les documents concernés par la future campagne de numérisation. Cette phase a permis aussi de regrouper les documents selon leur provenance et leur lieu de publication. Le passage en revue de ces fonds aura aussi facilité la préparation des documents pour la numérisation : dépoussiérage, inventaire physique disponible sous format excel.
Un projet réalisé chez le client
Numérisation au Sénégal
L’IDEP a souhaité que le projet de numérisation soit réalisé sur place pour pouvoir continuer à offrir à ses visiteurs l’accès aux documents originaux. Cela permet d’autre part de créer de l’emploi au niveau local.
Une numérisation réalisée en 2 étapes successives
La numérisation des archives de l’IDEP qui portait sur 520 000 pages de publications diverses a été réalisée en 2 étapes. Cette décision a été prise pour permettre un benchmark en termes de productivité au regard du caractère très hétérogène des documents à traiter. La première phase, qui portait sur 260 000 pages a été réalisée en 6 mois de prestation. L’analyse de cette première étape a permis de définir le modèle de production optimum tant sur le plan qualitatif que quantitatif qui allait être mis en place pour la 2 ème phase.
Mr Antonin Benoit Diouf, Chef des services de bibliothèque et de documentation
Une optimisation de la gestion des archives
Cette opération aura d’autre part permis d’assainir les collections de la bibliothèque et d’optimiser les espaces de stockage. Dans le cadre de ce projet, la bibliothèque va piloter la destruction de documents déclarés hors d’usage ou disponibles en plusieurs exemplaires. Les espaces de stockage sont ainsi optimisés pour l’archivage physique futur des prochaines publications de l’IDEP.
TÉMOIGNAGE
« L’IDEP est en capacité de pouvoir dorénavant diffuser ces produits de connaissance aux états membres… »
« L’IDEP est en capacité de pouvoir dorénavant diffuser ces produits de connaissance aux états membres que ce soit par le biais d’un site web ou de supports électroniques portables (DVD-Rom, clefs USB, …). L’IDEP reste dépositaire de la version papier, source unique de référence. »
Mr Antonin Benoit Diouf, Chef des services de bibliothèque et de documentation