Documentation professionnelle

6. La migration de la base BN Opaline Musique

Contexte général

Depuis les années 1980, la Bibliothèque nationale a développé deux bases en ligne pour la saisie des données : la base BN Opale pour les livres et les périodiques et la base BN Opaline Musique pour les documents spécialisés.
La base BN Opaline développée par Michel Schutz (dont nous regrettons la disparition en cette année 2007) et son équipe s’est construite sur le principe de sous-bases séparées pour chacun des départements concernés, dans l’ordre, Cartes et Plans (1986), Estampes, Phonothèque devenu département de l’Audiovisuel, Musique puis Arts du spectacle. Ce développement s’est fait en parallèle avec la rédaction de différents Intermarc largement inspirés à l’époque par le LC Marc très ouvert aux documents non livres et non par l’UNIMARC. Une autre caractéristique de la base BN Opaline était l’existence de modules d’entrée distincts des modules de catalogage, bien que certains éléments aient pu être automatiquement reversés dans le module catalogue. Une autre caractéristique commune avec la base BN Opale était l’architecture solidement établie entre les fichiers d’autorités (personnes physiques, collectivités, mots matières, puis, pour l’Audiovisuel et la Musique, titres uniformes) et les notices bibliographiques. Parmi les derniers développements apportés par Michel Schutz, l’un des plus importants fut le lien entre notice du catalogue et image numérisée réalisé en 1998, innovation essentielle qui a été « importée » ensuite dans BN Opale Plus. Une autre innovation a été réalisée sous l’impulsion du département des Arts du spectacle : il s’agit des notices spectacles, conçues non pour un document mais pour un événement immatériel, sous forme de notice « chapeau » qui regroupe toutes les informations sur un spectacle y compris les noms des interprètes et de tous les intervenants. A partir de cette notice, on peut rattacher toutes sortes de documents, dossiers de presse, documents manuscrits, éditions, éléments iconographiques etc. Ce type de notice est évidemment aussi utilisé par la Bibliothèque-Musée de l’Opéra.
Cette organisation générale a eu pour conséquence le fait que les départements spécialisés ont été amenés pour certains, dont le département de la Musique, à cataloguer leurs documents dans deux bases différentes selon leur nature (ceci n’a pas été le cas des Cartes et Plans qui avait fait le choix du tout BN Opaline).
La base BN Opaline a été fermée à la fin de 2006, la principale raison étant l’obsolescence de l’ordinateur qui l’hébergeait, un Bull DPS7. Une autre raison d’ordre plus stratégique était de créer un catalogue unique reflétant l’unité des collections de la Bibliothèque nationale de France alors qu’elles se trouvent localisées sur plusieurs sites dont les deux principaux, Richelieu et François Mitterrand. Le programme de migration qui a été décidé s’inscrit dans le schéma informatique des départements spécialisés du site Richelieu ; il représente l’une des composantes d’ordre scientifique de la rénovation de ce site. Le fait que la base du département de l’Audiovisuel -installé depuis 1998 sur le site François Mitterrand- ait été développée dans BN Opaline a certainement joué un rôle majeur dans ce schéma général. C’est d’ailleurs par ce département qu’a été engagé le processus avec la migration des quelque 400 000 notices du département achevée avec succès en 2004. Ont suivi le département des Arts du spectacle à l’automne 2005 (environ 50 000 notices) et le département de la Musique en janvier 2006. Au cours de l’année 2006 ont été achevées les migrations des bases du département des Estampes et du département des Cartes et Plans.
En parallèle, la base BN Opale avait fortement évolué à la fin de la décennie 1990 pour se voir intégrée dans le nouveau système d’information de la Bibliothèque nationale de France. Cette nouvelle base dite maintenant BN Opale Plus qui existe depuis 1998 présente quelques particularités que je ne ferai qu’esquisser.
L’une d’elles est liée à la création du système de transport automatique des documents (TAD) qui a marqué l’ouverture du site François Mitterrand en 1998 ; ce système est basé sur la notion d’identification d’une UC (unité de conservation) identifiée par un code barre. Le déménagement du département des Imprimés depuis le site Richelieu avait été précédé d’un recollement accompagné de la saisie de la totalité des cotes dans une base spécifique qui constitue encore une « épine dorsale ». Dans la base BN Opale Plus, les données locales dont la cote et les particularités d’exemplaire apparaissent dans une notice à part dite notice d’exemplaire, liée à la notice bibliographique. Dans la version actuelle du SI, cette notice d’exemplaire permet aussi aux départements de collections du site François Mitterrand de gérer  les unités de conservation pour toutes les opérations concernant la reliure et la conservation
Le système d’information étant un système fortement intégré, il comporte également des modules d’entrée, ce qui existait déjà d’une façon embryonnaire dans BN Opaline mais qui a été développé à une tout autre échelle, en particulier pour le dépôt légal et pour les acquisitions. Dans BN Opale Plus, il n’existait pas de module d’entrée don : il a été créé à la faveur de la migration de la sous-base Musique au début de 2006. Pour les acquisitions, le « module » d’entrée prend aussi en compte l’aspect gestion dès l’opération de commande initiale (d’où entre autres le lien avec une base des fournisseurs) et il est lié aux applications d’ordre financier qui sont gérées par un système autre mais fortement lié. La création de la base BN Opale Plus a aussi entraîné une nouvelle conception des fichiers d’autorités, tout particulièrement le regroupement des autorités personnes physiques, qu’elles soient utilisées en vedettes auteurs ou assimilés ou en vedettes matières (notion de grappe).
Pour ajouter encore un peu plus de complexité à ces évolutions, ajoutons que le format Intermarc lui-même a fortement évolué dans les années 1990 pour homogénéiser et rendre cohérents ses divers développements : le format Intermarc intégré concerne tous types de documents et aussi bien les autorités que les notices bibliographiques (il ne concerne pas les notices d’exemplaires). Les sous-bases BN Opaline étaient donc soit uniquement en format Intermarc intégré soit utilisaient les deux formats, ce qui était le cas de la sous-base Musique.
Les opérations de migration d’une telle importance vont bien au-delà des questions techniques : il s’agit aussi d’un changement de culture, d’organisation du travail et de méthodologie  qu’il a fallu accompagner et préparer, en particulier par de solides et lourdes actions de formation. Parmi les changements majeurs, signalons le fait que les informations concernant un document peuvent apparaître en accès public bien avant la phase de catalogage, à partir de la saisie faite dans les modules d’entrée (dépôt légal, don, acquisition). Ces opérations ont aussi concerné la Bibliographie de la France, supplément Musique, qui continue d’être présentée en ligne, à l’exclusion de tout autre support : les notices se trouvent donc accessibles soit organisées à l’intérieur d’un cadre de classement et en fonction de la parution des documents, soit via la base générale BN Opale Plus.

Le point de départ : la base BN Opaline Musique

Je reprends ici pour l’essentiel les données fournies par François-Pierre Goy, chef de projet de la migration.
Ouverte en avril 1991, la base BN Opaline Musique (OPD) contenait à sa fermeture le 19 décembre 2005 184 859 notices bibliographiques, dont un bon tiers issu de plusieurs chargements provenant principalement des opérations de conversion rétrospective conduits sous la direction de Sébastien Gaudelus. Les deux tiers restant représentent le catalogage courant du département de la Musique et de la Bibliothèque-Musée de l’Opéra depuis 1991.
Le contenu de la base reflète la diversité des documents qui entrent au département de la Musique puisque lors de la fermeture des fichiers manuels après leur microfilmage en 1992, on a décidé de traiter en ligne tous les types de documents y compris les documents manuscrits (manuscrits musicaux et lettres autographes) et les images fixes.
Ce contenu reflète également des strates de catalogage très différentes. En voici quelques exemples au fil de la description des différents types de documents.

  1. musique imprimée entrée par dépôt légal depuis 1946 soit :
    • le catalogage courant depuis 1991 de la totalité des documents entrants
    • le chargement d’environ 10 000 notices faiblement formatées des années 1981-1990 (exemple : un bloc pour la zone titre et mention de responsabilité ; un autre pour l’adresse bibliographique et la description matérielle)
    • le chargement d’une base Access pour la musique dite légère (non incluse dans la Bibliographie de la France imprimée) 1967-1990 soit environ 30 000 notices
    • la conversion rétrospective avec un lot pour la Bibliographie de la France supplément Musique 1946-1980 et un lot pour le fichier dit « musique légère » 1946-1967 (fichier manuel classé par titre).
  2. acquisitions et dons entrés depuis 1992 (partitions imprimées et manuscrites, correspondances de musiciens, documents d’archives, etc.)
  3. manuscrits musicaux antérieurs à 1800 (catalogage rétrospectif en cours dans le cadre du RISM) ; les notices des manuscrits de compositeurs dont les noms commencent par les lettres A et B ont été faites sur bordereaux et ont donné lieu à une saisie par les AIC et à un chargement en 1994 ; l’incipit musical ne pouvant être inclus dans les notices, celles-ci ont aussi été publiées en 1999 dans le Catalogue des manuscrits musicaux antérieurs à 1850 conservés au département de la Musique A et B (Paris, Bibliothèque nationale de France, 1999), le volume suivant étant en cours de relecture. Depuis 1994, les notices sont saisies en ligne (parmi les derniers compositeurs importants traités : Christoph Willibald Gluck, Grétry et Galuppi).
    A noter que les 7700 notices réalisées dans le cadre de ce programme ont été envoyées début 2006 à la rédaction centrale du Répertoire international des sources musicales (RISM) à Francfort. Confiées au prestataire de service qui gère cette base (Aztec), elles n’ont malheureusement pas encore été intégrées dans la base payante du RISM.
  4. portraits de musiciens (images fixes) : environ 10 000 notices soit reprises d’un fichier manuel avec fiches questionnaires soit résultant du catalogage avec reprise d’éléments d’un fichier manuel ; ce programme fut lié à la numérisation des portraits de musiciens (environ 8000 accessibles car dans le domaine public) qui peuvent être vus dans la base Gallica. L’interrogation dans la base BN Opale Plus se fait logiquement par le nom du compositeur considéré comme mot sujet.
  5. documents iconographiques et partitions de la Bibliothèque-Musée de l’Opéra (catalogage courant et rétrospectif) ainsi que les dossiers d’artistes.
  6. manuscrits littéraires et correspondances de la Bibliothèque-Musée de l’Opéra qui ont été catalogués dans le cadre du projet PALME.

Il faut y ajouter environ 1200 notices décrivant des manuscrits de bibliothèques extérieures (patrimoine musical régional), qui n’ont pas été extraites pour la migration.
Dans la volumétrie totale, il ne faut pas oublier les notices d’autorité soit :
Les 81058 notices d’autorité (hors élémentaires), toutes dans l’ancien format Intermarc (A), qui étaient de type APP ou maintenant PEP (autorité personne physique), ACO ou ORG (autorité nom de collectivité), ATUM ou TUM (titre uniforme musical et AMA ou RAM (autorité matière soit noms communs, noms géographiques et subdivisions).Après tous les dédoublonnages, les proportions de notices élémentaires pour les différents types de notices d’autorité sont les suivantes : 58 % des PEP, 56 % des ORG, 43 % des TUM. En effet, après la conversion, les APP et ACO ont été dédoublonnées avec leur équivalent AMA quand la vedette était identique, ce qui n’était malheureusement pas toujours le cas. De plus, les dédoublonnages au chargement ont permis de dédoublonner plus de 1100 notices MON (monographies) avec la notice DAE (domaine des acquisitions entrant) correspondante ainsi que 10,5 % des notices d’autorité PEP, ORG et TUM. Les RAM (nom commun, nom géographique et collectivité) ont été entièrement dédoublonnées.

Seule une petite partie des notices bibliographiques (2,8 %) était à la source en format intégré : il s’agissait exclusivement de documents de la Bibliothèque-Musée de l’Opéra liés à des notices de spectacles (elles-mêmes en format intégré) ou chargés de la base PALME. Dans ce cas, les données locales se trouvaient dans une notice de données locales liée à la notice bibliographique et non dans des zones Intermarc comme c’était le cas pour les autres notices.

Les opérations en amont de la migration et son déroulement (1)

Les spécifications de conversion ont été rédigées à partir d’avril 2004. La version de référence a été remise, après validation par l’Agence bibliographique nationale, à l’équipe migration du DSI (département des systèmes d’information) fin mai 2005. Les règles de conversion ont été ajustées sur des points de détail jusqu’au dernier moment, en fonction des résultats des trois jeux d’essai et de petites évolutions apportées au format.
Il a fallu mener à bien un certain nombre de gros chantiers de reprises de données, manuels ou automatisés, par exemple :
préparation du dédoublonnage de l’indexation matière : saisie dans BN Opale Plus des notices nécessaires (vedettes multiples) par la Direction des services et des réseaux, propositions au FNPR, report du numéro de notice BN-Opale Plus dans les notices Opaline (4240 notices concernées sans compter les subdivisions)
préparation du dédoublonnage des acquisitions avec les notices générées par DAE : report du numéro de notice BN-Opale Plus dans les notices BN Opaline (au catalogage ou rétrospectivement)
correction d’indexation pour les arrangements et certaines vedettes de musique vocale : chantier en partie automatisé
reformatage d’environ 1700 notices à niveaux provenant d’une conversion rétrospective
et bien d’autres de moindre importance.
Les premiers tests de catalogage de nos types de documents dans le module de saisie A-DCAT-02, au printemps 2006, ainsi que la préparation de la migration, ont amené un certain nombre de corrections de détail du Référentiel Intermarc.
Sur le plan de l’application, de nouvelles zones ont été ajoutées à des index existants : 520 (incipit textuel) à l’index TIT, 023 (cotage et numéro d’éditeur) à l’index REF. Comme, contrairement à l’ancien Intermarc, le type de document ne distingue plus entre musique imprimée et musique manuscrite, c’est un filtre sur la position 01 du 009c qui permet à présent de les séparer (valeur ajoutée au filtre actuellement intitulé « Caractéristique typographique »).

Dans le format de données locales, l’ajout d’un nouvel usage (D = déposé dans une autre bibliothèque) a permis de résoudre le problème des exemplaires en dépôt à la Médiathèque Hector-Berlioz (médiathèque du Conservatoire national supérieur de musique et de danse de Paris).

Les applications DAE ont également connu des évolutions nécessaires pour l’intégration de nos documents. Un nouveau module (Dons, legs et échanges entrants) a été créé.
Une opération particulière a été conduite sur les AMA par la saisie préalable d’environ 2400 notices dans BN Opale Plus par le service Autorités.
Voici les types de documents à la cible : musique imprimée (84%), image fixe (5%), musique manuscrite (4 %), manuscrit moderne et document d’archive (3,3 %), texte imprimé (0,4 %) et enregistrement sonore (0,07 %). Il faut y ajouter 830 notices de spectacles provenant de la BMO.
Types de notices (à la cible) : MON (97 %, dont 3 % comportent des ANL), ENS (0,8 %), COL (0,5 %), REC (0,5 %), SPE (0,4 %).

Les formations

Les utilisateurs ont été formés aux applications DAE, à l’application A-DCAT-02 et au format intégré tout au long des mois de janvier et février 2006. La production dans le catalogue a commencé vers le 1er mars 2006. Un module spécifique destiné aux vacataires du Répertoire international des sources musicales (RISM manuscrits musicaux avant 1800) a été élaboré.
Quatre nouveaux manuels bibliographiques ont été rédigés pour Kitcat (manuel de catalogage en ligne) : deux d’entre eux – musique imprimée et manuscrite, spectacles – sont des adaptations de manuels existants déjà utilisés sur BN Opaline ; les deux autres – image fixe, manuscrit moderne et document d’archives – ne sont pour l’instant guère plus que des formats très peu commentés. Le manuel spécifique pour le catalogage de la musique imprimée et manuscrite antérieure à 1800 a été adapté au format intégré.
Sur deux mois, les formations ont impliqué pour 4 groupes d’environ 35 personnes les formateurs (tandem), les utilisateurs et les producteurs de notices. Les formations ont été réparties selon les domaines suivants : entrées, consultation du catalogue professionnel, catalogage, autorités, données locales.
En outre, a été préparée une aide en ligne ainsi que la mise à niveau de tous les documents de référence.

Comment accéder aux documents ?

Le catalogue public de la base Bn Opale Plus comporte une icône spécifique dédiée à la musique imprimée et manuscrite. Il faut donc rechercher les autres documents conservés au département de la Musique à partir des autres icônes : livres, périodiques, images fixes (les portraits de musiciens), documents d’archives (les lettres autographes). Les autorités sont surlignées en bleu.
En outre, depuis la migration de 2006, ont été rendues accessibles les  conversions rétrospectives suivantes : Catalogue de la musique imprimée conservée dans les bibliothèques publiques de Paris par François Lesure (éditions conservées au département de la Musique, à la Bibliothèque-Musée de l’Opéra et à la Bibliothèque de l’Arsenal soit 15500 notices) ainsi que les lettres autographes conservées au département de la Musique décrites soit individuellement soit par lots (notices correspondant soit au catalogue d’Antoine Bloch-Michel publié en 1981, soit aux fichiers manuels dont celui de la correspondance adressée à Nadia Boulanger). La conversion rétrospective du fichier général a commencé en novembre 2006 et devrait être achevée vers 2012 avec 650 000 notices attendues (voir l’article suivant « De nouvelles références musicales dans BN-Opale Plus » par Sébastien Gaudelus).


  1. Texte de François-Pierre Goy

Catherine Massip, François-Pierre Goy,
BnF, département de la Musique

Imprimer Retour haut de page