8. Deuxième session – Vers un web sémantique
1. Le portail de la musique contemporaine en France
Michel Fingerhut (IRCAM, Paris)
Le Portail de la musique contemporaine en France, réalisé courant 2007 dans le cadre d’un partenariat entre six organismes détenteurs et/ou producteurs de ressources concernant ce domaine, s’est étendu en 2008 à huit autres partenaires. Il a pour objectif d’encourager la rencontre entre les publics et la création musicale contemporaine et ses créateurs en France, et d’affirmer leur rayonnement par l’entremise du numérique et des réseaux. Il souhaite donner ainsi une plus grande visibilité à l’événement (concerts, conférences, formations…) et faciliter la localisation de vastes ressources documentaires et fonds d’archives souvent confidentiels et donc ignorés du grand public. Il vise aussi à fournir un accès direct intégral ou partiel à des ressources numériques ou numérisées (et notamment des enregistrements sonores). (1)
Actuellement, le portail référence environ 100 000 ressources dont 20% de contenu en ligne.
Ont été décrits le dispositif en place, la modélisation des métadonnées communes au documentaire et à l’événementiel et les aspects de droits concernant l’accès aux contenus.
Pour moissonner les informations des différents partenaires, le portail utilise un protocole standard de communication en réseau, OAI (open archive initiative). Les informations sont sous forme de métadonnées (codées en XML), qui utilisent le format MODS pour décrire les ressources selon un modèle élaboré en commun. MODS, qui est dérivé du format MARC, présente de nombreux avantages : il s’adapte facilement à des données hétérogènes, la plupart de ses champs étant optionnels. Il permet de conserver les relations existant entre divers éléments (personne/rôle, sujet/auteur/titre…), ce que ne fait pas Dublin Core, ainsi que de décrire les différents niveaux hiérarchiques entre les notices (par exemple CD/pistes). Enfin il est extensible et peut donc intégrer de nouvelles données : instrumentation, droits d’accès aux contenus (intranet/extranet/internet).
En ce qui concerne l’accès aux contenus numérisés progressivement mis en ligne (2), il est fonction des droits d’accès propres aux documents et de ceux de la personne consultant le portail : soit sur internet, soit dans un extranet (réseau de partenaires), soit seulement dans les murs de l’organisme dépositaire.
La dernière version du Portail propose désormais une version en anglais, ainsi qu’une documentation détaillée accessible en ligne (www.musiquecontemporaine.fr/doc).
Enfin, plusieurs perspectives de développement peuvent être évoquées : l’intégration de nouveaux partenaires, le développement d’une navigation sémantique et l’extension du projet au niveau européen (notamment la moisson des ressources en ligne du portail par Europeana, la bibliothèque numérique européenne).
Lien vers les diapositives de l’intervention :
http://mediatheque.ircam.fr/articles/textes/Fingerhut08a/index.ppt
2. Topic maps ou Comment organiser son savoir au XXIe siècle (avec une référence à l’opéra italien)
Steve Pepper (Ontopedia, Norvège)
L’un des plus grands défis que doivent affronter les bibliothécaires musicaux aujourd’hui consiste à organiser les collections numériques de manière à ce que l’on puisse partager notre savoir et faciliter la recherche pour les usagers.
Les Topic maps, littéralement « cartes de sujets », constituent, sous la forme d’une nouvelle norme internationale, une réponse à cette problématique. Comment fonctionnent les Topic maps, que peut apporter cet outil aux classifications par sujets au 21ème siècle, comment permet-il de partager le savoir et de trouver l’information ?
Les Topic maps reposent sur une approche « centrée sujet » pour la gestion de l’information et du savoir : mettre les sujets, et non les documents ou les ordinateurs, au centre de notre univers informatique. Ce sont en effet les sujets qui intéressent les gens lorsqu’ils font une recherche, et ils devraient pouvoir trouver des informations sur ces sujets sans avoir à se soucier des documents dans lesquels ils se trouvent, ou des applications qui ont permis de créer ces documents.
Le point faible des moteurs de recherche, c’est qu’ils sont facilement induits en erreur par les mots qui ont plusieurs sens, ou par les choses qui ont des dénominations multiples.
Pour pouvoir vraiment trouver ce dont nous avons besoin, au moment où nous en avons besoin, nous devons commencer à organiser notre information différemment : par sujet. C’est justement l’objet de Topic maps.
Qu’est-ce que Topic maps ?
une norme internationale pour l’organisation du savoir (ISO/IEC 13250)
un modèle de données pour représenter les thésaurus.
Les Topic maps permettent de représenter les connaissances en utilisant :
des sujets (topics en anglais), qui représentent tout type de concept (personnes, pays, organismes, événements…)
des associations, qui représentent les relations entre ces sujets
des occurrences, liens vers des ressources se rapportant à un sujet particulier.
On peut établir une comparaison avec la division d’un livre entre son contenu et l’index de fin d’ouvrage :
XXXX
Les topics représenteraient les sujets, les associations s’apparenteraient au « voir aussi » de l’index de livre.
A titre d’exemple, une application particulière d’un topic map à l’opéra italien a été réalisée.
Le concept opéra italien représente alors le point central d’indexation (topic), à partir duquel on doit pouvoir trouver toutes les informations relatives à ce sujet, grâce au réseau sémantique généré par les associations. Cette représentation permet de répondre à des requêtes du type :
« Quels opéras italiens ont été créés à Naples, et quand ; par quels compositeurs et librettistes ; où puis-je trouver plus d’information sur ce sujet ? »
L’intérêt des Topic maps est qu’ils sont totalement génériques et adaptables à tous les domaines. Cet outil représente-t-il l’avenir de l’information gérée par les bibliothèques ?
Pour plus d’information : www.ontopia.net
3. RAMline, pour réécrire l’histoire de la musique
Antony Pitts (Royal Academy of Music, Londres)
RAMline (nommé ainsi par référence à la Royal Academy of Music, qui a initié le projet)est un index unique et multidimensionnel de la musique et des musiciens.
Outil pédagogique conçu pour cartographier l’histoire de la musique, son ambition est double :
trier et lier les contenus à l’intérieur d’une chronologie musicale
établir un classement par catégorie selon sept étapes essentielles du processus musical : l’idée, le compositeur, la partition, l’interprète, le son, le public, l’histoire.
Le projet a consisté d’abord à créer une ontologie : les sujets (topics) contiennent des informations sur eux-mêmes, des liens sur les documents se rapportant à ces mêmes sujets et des liens sur d’autres sujets, créant une carte de la connaissance.
Le moteur de recherche qui gère RAMline utilise Topic maps.
Grâce à des mots-clés, les utilisateurs peuvent naviguer ou effectuer des recherches à partir de cette carte pour trouver des informations. Le résultat est un index détaillé des informations provenant de différentes sources par l’intermédiaire d’un portail unique.
Multidimensionnel par sa capacité à être exploré à la fois à partir de noms de personnes, d’œuvres, d’endroits, d’événements ou de dates, RAMline se distingue aussi par les liens existant entre les musiciens et les œuvres, qui permettent de comprendre les processus et les résultats produits.
Cet index est relié à des archives numériques locales ainsi qu’à d’autres ressources en ligne (manuscrits, éditions papier, enregistrements de concerts, critiques et commentaires musicaux). Il peut servir à présenter une chronologie de l’histoire de la musique et le cycle de vie d’une œuvre, de l’Antiquité à aujourd’hui, ou encore à dresser une carte des profils musicaux d’individus ou d’organismes.
RAMline est actuellement au stade de prototype.
Les prochaines étapes concernent l’intégration d’événements et de ressources de la Royal Academy of Music, de portfolios numériques, ainsi que le développement de collaborations.
A terme, RAMline devrait être librement accessible en ligne.
Compte rendu de la session : Isabelle Gauchet Doris
Mercredi 23/07 11h-12h30
Passé et présent : Conservation et accès aux événements musicaux enregistrés
1. Conservation en ligne et accès aux traces des événements musicaux
Michel Fingerhut (IRCAM, Paris)
Les événements musicaux de l’Ircam se caractérisent par leur diversité (concerts, conférences, master classes…) et par les liens qui les relient. Les événements sont structurés en groupes d’événements (saison, cycle, festival), un même événement pouvant faire partie de différents cycles.
Une manifestation se définit comme l’occurrence d’un événement, habituellement avec unité de date, d’heure et de lieu (par exemple un concert).
Un cycle est un groupe d’événements, un événement pouvant faire partie de différents cycles.
La Médiathèque de l’Ircam collecte, depuis 1995, les traces des événements musicaux de l’Ircam, et plus généralement de ses saisons. Ces traces sont de deux types :
- documents pdf : brochures de saison et de cycles, etc. et notes de programme
- enregistrements sonores.
Le circuit documentaire
Depuis 2006, la médiathèque a développé un dispositif (base Archiprod) destiné à faciliter la collecte de ces documents auprès de leurs producteurs (en amont de l’événement pour la documentation, en aval pour son enregistrement), à les décrire et à les organiser (métadonnées correctes reflétant autant la structuration de la programmation annuelle que l’événement détaillé), à les conserver et à y fournir l’accès en ligne.
Le circuit documentaire aujourd’hui :
XXX
Les métadonnées permettent de décrire précisément chaque événement, ainsi que les relations entre eux.
On trouve notamment des éléments descriptifs :
- titre, sous-titre
- type (saison, série de concerts, conférence, cours…)
- date (début, fin)
- evénement « parent »
et des éléments permettant de catégoriser les événements :
événement artistique | ||
spectacle | concert spectacle chorégraphique spectacle théâtral etc |
|
projection | ||
exposition | ||
autre événement artistique | ||
rencontre | ||
conférence | conférence – analyse d’une œuvre conférence scientifique / technique autre conférence |
|
autre événement |
Les formats utilisés pour les traces des événements sont les suivants :
Pour la conservation :
Audio : WAV 44,1 KHz, 16 bits min.
Image : TIFF
Métadonnées : METS
Pour l’accès en ligne :
Documents audio :
accès local = MPEG 1 Layer 2, enregistrement intégral
accès des partenaires (extranet) : MP3 haute définition, enregistrement intégral
accès internet : MP3, extrait
Documents texte : pdf
Métadonnées : MODS
L’interface de recherche de la base Archiprod offre d’une part une recherche classique par requête sur des champs indexés ou en texte intégral, d’autre part une recherche par navigation dans une arborescence des événements.
Par ailleurs, des campagnes de numérisation rétrospective et de reprises d’anciennes numérisations sont en cours.
Le traitement rétrospectif a concerné la numérisation de bandes, de notes de programmes… De plus, le catalogage des événements a été mis en place (15 années traitées soit plus de 1100 événements, 16 années restant à traiter).
L’objectif est d’optimiser les interconnexions entre les différentes bases de données :
Archiprod pour l’archivage des concerts, Brahms pour les bios de compositeurs, Mustica (documentation technique des œuvres), Loris (base bibliographique), et enfin le site web de l’Ircam (événements futurs).
Actuellement, le portail de la musique contemporaine (www.musiquecontemporaine.fr) permet de fournir une première réponse à cette problématique. Un système d’agrégation automatique des événements dans le portail est envisagé. Et à plus long terme, on pourrait s’orienter vers l’organisation des données événementielles selon des référentiels indépendants (événements, personnes, œuvres, lieux, fonctions).
Lien vers les diapositives de la présentation :
http://mediatheque.ircam.fr/articles/textes/Fingerhut08b/index.ppt
2. Les avancées des TIC (3) pour la conservation et l’accès aux grandes archives musicales : principaux dispositifs et études de cas
Goffredo Haus (LIM – Laboratorio di Informatica Musicale, Università degli Studi di Milano (4))
La présentation concerne la problématique de la conservation, de l’organisation et de la recherche d’information dans de grandes archives de musique. Les processus dans un tel environnement sont particulièrement hétérogènes et complexes, comprenant d’une part la production artistique, l’édition, la gestion économique, les activités logistiques, d’autre part les partitions et médias audiovisuels correspondants.
Conserver et parcourir les archives musicales, audio et multimédia
Face à la diversité et à l’hétérogénéité des ressources musicales, il est important de concevoir des outils pour sauvegarder, numériser et indexer les contenus et les métadonnées correspondantes, et ensuite pouvoir parcourir ces ressources dans le cadre de réseaux locaux comme sur internet.
Ainsi, des projets innovants de conservation ont pu trouver des applications : archives du Teatro alla Scala, du Théâtre Bolchoï, archives historiques de la Casa Ricordi…
Les contenus des archives sont caractérisés par :
- la codification des données
- les typologies de l’information (audio, images, vidéo)
- les métadonnées (normes, gestion des droits numériques)
- les ontologies
Il est nécessaire de classer les données hétérogènes qui doivent être mises en relation pour obtenir des archives complètes et efficaces.
Les avancées des méthodes et outils des TIC ont permis d’améliorer la satisfaction des utilisateurs lorsqu’ils parcourent les contenus musicaux. Ainsi grâce aux recherches du LIM, un système de codification multicouche de la musique a été développé : MX (« Music application using XML »), qui a abouti à la création d’une nouvelle norme : IEEE PAR 1599.
La norme IEEE 1599 est un format de description des contenus musicaux hétérogènes basé sur XML. En effet, pour être complète, une description de la musique doit pouvoir intégrer des matériaux hétérogènes. Or le langage XML permet de fournir la structure pour représenter ce type d’information. IEEE 1599 utilise ainsi différentes couches pour représenter l’information, notamment :
- les métadonnées relatives à la musique, c’est-à-dire les informations sur l’œuvre
- la description de la partition
- l’exécution de l’œuvre (description et exécution de la musique sur ordinateur
- audio (enregistrements numériques ou numérisés de l’œuvre)
Grâce à ce nouveau format de la musique et à l’interface fournie par une telle application, les utilisateurs peuvent diversifier leur approche de la musique : ils ont ainsi la possibilité de parcourir différents livrets, partitions, exécutions vidéo et audio de la même pièce ; de plus, chaque type de contenu peut être utilisé comme le principal média à partir duquel tous les autres contenus correspondants sont synchronisés.
L’interface permet ainsi la consultation simultanée et synchronisée de différents documents :
- enregistrement audio + lecture simultanée de la partition
- comparaison de plusieurs enregistrements audio
- consultation de la vidéo avec la partition
- lecture de la partition + texte livret + enregistrement audio
- pour le jazz : synchronisation audio + grille d’accords
Le système permet aussi de modifier les paramètres de différents médias. Par exemple, pour un enregistrement audio et la partition correspondante, on peut lancer l’enregistrement, effectuer une transposition en cours de lecture, puis accélérer le tempo…
Un certain nombre de projets réalisés peuvent être cités :
- projet MAIS au Teatro alla Scala : interface offrant des interactions multimodes soit par contenus musicaux (partitions, notes, livrets, lecteur audio), soit par thèmes musicaux
- expositions organisées par le Ministère italien des Héritages Culturels en Europe
- REMI : REte della Musica Italiana (Réseau de la musique italienne)
REMI – Portail « Internet Culturale »
La présentation se termine par une démonstration de l’utilisation de la base REMI à partir du portail « Internet Culturale » du MiBAC (www.internetculturale.it/).
A titre d’exemple, une recherche effectuée sur La Bohême de Puccini permet de consulter tous les documents se rapportant à cette œuvre : différentes versions de la partition (manuscrite / éditée), esquisses, croquis, photographies etc.
Cette interface de recherche, conçue spécifiquement pour la musique et basée sur un système de recherche relationnel, permet une navigation intégrée parmi différents documents : des autographes aux partitions imprimées ; des lettres aux livrets ; des esquisses de scènes aux photographies (les ressources consultables proviennent notamment des Archives historiques de la Casa Ricordi).
Compte rendu de la session : Isabelle Gauchet Doris
- Pour l’historique et la description générale du projet, voir le résumé de la présentation effectuée lors des Journées professionnelles 2007 du Groupe français de l’AIBM, Bulletin n° 15.
- La numérisation des fonds se poursuit chez les différents partenaires.
- Technologies de l’information et de la communication
- www.lim.dico.unimi.it