La version 2 de Pleade n'est plus officiellement développée par Anaphore et AJLSM. Si des bogues bloquants sont constatés, ils pourront toutefois être corrigés.

Nous encourageons tous les utilisateurs de Pleade 2 à songer à une migration vers la version 3.

La version 3.1 est disponible depuis le 24 février 2009 sur SourceForge : > > Télécharger...

Voir le site de démonstration de Pleade 3 : > > Démonstration de Pleade 3

Plus d'information sur Pleade 3 : http://pleade.com/

Présentation générale de l'outil PLEADE

Ce document a pour objectif de présenter les fonctionnalités envisagées de PLEADE, un environnement complet pour la recherche et la consultation d'instruments de recherche archivistiques structurés en format XML EAD. Cet environnement sera initialement développé conjointement par les sociétés AJLSM et Anaphore au cours du premier semestre de l'année 2003. Une première sortie a suivi les journées Arkhéïa 2003, du 14 au 16 mai au Puy-en-Velay (Haute-Loire, France).

PLEADE cherche à répondre à un besoin précis au sein des services d'archives : comment, en suivant les normes préconisées, offrir aux lecteurs des instruments de recherche archivistiques riches et faciles à consulter, dans la salle de lecture ou à distance ? La réponse que nous proposons est d'offrir un outil souple et configurable, dans une architecture Web, qui offrira de la recherche dans les instruments de recherche ainsi que la visualisation de ces instruments de recherche. Cet outil pourra être utilisé en intranet comme sur Internet ; seul un navigateur Web standard sera nécessaire pour l'utiliser.

L'objectif de ce document est de fournir toutes les informations disponibles sur cet outil afin de susciter dès le début du développement des commentaires ou suggestions de la part des personnes intéressées. Ce document n'engage en rien les différents partenaire impliqués ; l'outil pourrait ne pas implanter toutes les fonctionnalités décrites ici, tout comme il pourrait en offrir de nouvelles, non discutées dans ce document.

Quatre grandes parties composent ce document. Une première présente brièvement la plate-forme technique sur laquelle s'appuie cet outil, car cette plate-forme pourra servir de base pour offrir des fonctionnalités complémentaires. Dans la seconde partie, nous allons définir quelques concepts importants.. Ensuite, dans la troisième partie une liste détaillée des fonctionnalités attendues est présentée. Nous terminerons par un aperçu du calendrier et de la méthodologie de réalisation.

1) Plate-forme technique

PLEADE est un outil de recherche documentaire pour documents XML en format EAD, dans une architecture Web et basé sur des logiciels libres. Pour développer les fonctionnalités en tenant compte de ces caractéristiques ou contraintes, il est tout à fait naturel de s'appuyer sur la plate-forme SDX, un outil de recherche et de consultation pour documents XML.

SDX est une initiative de la Mission de la recherche et de la technologie du ministère de la culture et de la communication (France). Le développement initial de la plate-forme a été réalisé par la société AJLSM, mais aujourd'hui ce développement est pris en charge par une communauté de plus en plus grande de développeurs et d'utilisateurs.

L'utilisation de SDX comme environnement de développement pour PLEADE permet non seulement d'obtenir les fonctionnalités envisagées, mais apporte également un certain nombres d'avantages que nous énonçons brièvement ici.

Normalisation

L'architecture de SDX s'appuie sur des normes, principalement XML et XSLT, qui en font un système très ouvert.

Souplesse

Par l'utilisation de l'environnement Cocoon 2, SDX offre une architecture informatique très souple qui permet de connecter aisément différentes sources d'information, de les transformer adéquatement, et de les présenter à l'utilisateur de façon ergonomique et personnalisée.

Déploiement et montée en charge

SDX, s'appuyant sur Cocoon, est un environnement Web dynamique basé sur les servlets Java. Cette spécification est supportée par de nombreuses applications qui ont démontré la souplesse de déploiement et la possibilité de montées en charge. Des composantes standard telles Apache ou Tomcat permettent d'offrir les services Web ou intranet de base, auxquels Cocoon et SDX ajoutent des services spécialisés pour la gestion de d'informations en format XML. Récemment, des tests effectués avec SDX ont montré qu'il pouvait prendre en charge des millions de documents sur des serveurs de moyenne puissance. Par ailleurs, par l'utilisation de l'environnement Java, SDX (et par conséquent PLEADE), peut être déployé sur une grande variété de plates-formes, allant de Windows à Linux en passant par Mac OS X et d'autres variations d'UNIX.

Caractère générique

SDX est un outil de recherche XML ; il n'est pas limité à l'EAD. Ainsi, PLEADE pourrait éventuellement être adapté pour supporter d'autres formats XML qui seraient utilisés dans les services d'archives, faisant ainsi de cet outil le coeur du système d'information documentaire d'un service. Par ailleurs, d'autres applications SDX génériques pourraient venir se greffer à PLEADE, notamment BiB-X, un outil de gestion de données bibliographiques.

Échange de données

Au cours de l'été 2003, SDX supportera le protocole OAI-PMH, la principale norme actuellement utilisée pour échanger des informations documentaires entre différents systèmes. Ainsi, PLEADE pourra bénéficier de ces développements et les bases documentaires créées à l'aide de cet outil pourront facilement communiquer avec d'autres sources d'information respectant cette norme, favorisant ainsi la mise en place de portails.

Ainsi, en utilisant SDX, PLEADE participera indirectement à une grande communauté d'utilisateurs qui partagent les mêmes grands objectifs, c'est-à-dire mettre en place des bases d'information documentaire sur Internet ou intranet.

2) Définitions préalables

Afin de bien comprendre la description fonctionnelle qui suit, nous présentons dans cette section quelques concepts reliés à PLEADE, aux applications documentaires, à SDX et à l'archivistique. Le lecteur est invité à consulter les références fournies pour en savoir plus.

2.1) L'EAD

L'EAD (Encoded Archival Description) est un modèle (une DTD, Document Type Definition) respectant la norme XML, modèle qui permet de structurer des instruments de recherche archivistiques. Ce modèle a été créé au milieu des années 1990 aux États-Unis, à l'initiative de la Library of Congress. La structure proposée est relativement souple et peut s'adapter à différents types d'instruments de recherche, tels des répertoires, inventaires, états des fonds, voire même des catalogues.

L'EAD constitue aujourd'hui la principale norme internationale pour la représentation informatique d'instruments de recherche archivistiques. Elle est depuis quelques années fréquemment utilisée en France, aux Archives nationales ou dans certains services d'archives départementaux, et la direction des archives de France la préconise. S'appuyant sur la norme XML, elle est donc tout à fait en phase avec les développements récents en informatique, où les échanges et la normalisation s'effectuent à l'aide de formats, et où la plupart du temps ces formats sont définis en fonction de la norme XML.

La DTD EAD est donc tout à fait appropriée pour constituer le modèle de base de l'application dont il est question ici, d'autant plus que de plus en plus d'outils permettent de produire des documents EAD. Ces outils peuvent être des éditeurs XML standards, ou des outils spécialisés tel le module Aide au classement du logiciel de gestion archivistique Arkhéïa.

Au mois de décembre 2002, une seconde version de la DTD EAD (appelée EAD 2002) a été rendue publique. Cette version n'est pas fondamentalement différente de la première, mais elle apporte quelques simplifications qui la rendent intéressante. Dans ce contexte, PLEADE supportera les versions 1 et 2002 de la DTD, avec cependant un meilleur support pour la version 2002. Toutefois, puisque des outils de conversion d'une version à l'autre seront bientôt rendus disponibles, cette contrainte ne devrait pas être un souci majeur pour les institutions ayant déjà produit des documents EAD.

A priori, tout document EAD valide pourra être intégré dans PLEADE et être géré convenablement, c'est-à-dire qu'il sera cherchable et consultable à l'aide d'un navigateur Web. Toutefois, cette gestion ne sera pas toujours optimale, car la grande variabilité d'une DTD telle l'EAD rend difficile, voire impossible la réalisation d'un outil totalement générique. La documentation fournira des informations sur les structures EAD qui seront optimales dans PLEADE.

2.2) Unités documentaires

L'unité documentaire est un concept important dans un outil de recherche et de consultation d'information de la nature de SDX. En effet, lorsqu'un utilisateur effectue une recherche, il obtient toujours une liste d'unités documentaires, qu'il peut par la suite consulter. Dans SDX, les unités documentaires sont les mêmes pour la recherche et la consultation, mais les possibilités offertes par le module de consultation de SDX permettent de faire abstraction de cette contrainte.

Un instrument de recherche au format EAD est un ensemble de descriptions archivistiques hiérarchisées. Chaque unité décrite doit être comprise dans le contexte de l'ensemble où elle se trouve, ensemble très souvent déterminé par le plan de classement prévu initialement. Parfois, ces descriptions sont très courtes, parfois elles sont plus longues. Parfois, elles contiendront d'autres unités décrites (donc à un niveau inférieur), parfois non. Dans l'identification des unités documentaires, l'outil devra tenir compte de cette variabilité.

Afin de rendre l'outil le plus générique possible, l'identification des unités documentaires pourra être paramétrée au moment de l'ajout d'un document ou d'un lot de documents. La première livraison de l'application permettra un certain nombre d'options prédéfinies, telles que :

  • Un certain type d'unité archivistique décrite (attribut type de l'élément c)

  • Une certaine profondeur hiérarchique dans les unités de description

  • Le nom de l'élément composant (c, c01, c02, etc.)

  • La présence ou l'absence de sous-éléments dans un composant

Par ailleurs, l'administrateur de l'application pourra fournir ses propres règles d'identification des unités documents sous la forme de fonctions en langage XSLT. Cette technique permettra une souplesse totale. Soulignons en terminant que l'instrument de recherche archivistique au complet sera toujours une unité documentaire avec comme contenu la description de premier niveau (l'élément archdesc).

3) Fonctionnalités générales

3.1) Ergonomie, charte graphique, langue

PLEADE sera livré avec une interface et une ergonomie standard. Toutefois, l'architecture de l'outil permettra de facilement intégrer des habillages (skins) personnalisés pour un site. Ainsi, un administrateur pourrait décider de changer de logo, les couleurs, les textes, etc.

La réalisation d'un habillage pourra se faire avec un maximum de quatre types d'interventions :

  • La modifications de documents XML pour les chaînes de caractères présentées à l'écran

  • La modification de feuilles de styles CSS pour des propriétés telles que les couleurs, les polices de caractères et leur taille, etc.

  • La création ou la modification d'images pour les logos, icônes, etc.

  • La modification de transformations XSLT pour des modifications touchant l'ordre des éléments présentés à l'écran

De façon générale, il ne sera pas nécessaire de toucher aux XSLT pour créer un habillage personnalisé, même si ce sera tout à fait possible sans remettre en cause le code source original de l'outil.

L'interface de PLEADE sera livrée en français et en anglais. Toutefois, toute l'architecture permettra une traduction très simple de l'interface en d'autres langues, et la sélection dynamique de la langue d'interface par l'utilisateur.

3.2) Gestion des utilisateurs

La gestion des utilisateurs de l'application PLEADE utilisera les fonctionnalités générales de SDX à ce sujet. Ainsi, comme toute application SDX, il y aura un groupe d'administrateurs qui contiendra au moins un utilisateur. Les membres de ce groupe auront le droit d'utiliser l'interface d'administration de SDX pour l'application PLEADE, ce qui aura notamment pour conséquence de leur permettre de créer, modifier et supprimer des utilisateurs et des groupes.

PLEADE utilisera également un second groupe d'utilisateurs standards, que nous nommons ici "éditeurs". Les éditeurs seront les personnes autorisées à ajouter et supprimer des instruments de recherche sur le site.

3.3) Informations statiques

Les informations statiques sont celles qui ne dépendent pas du contenu indexé dans PLEADE : page d'accueil, page d'information sur le site, etc. Bien entendu, PLEADE permettra de gérer de telles pages statiques, et ce d'une façon très simple.

En effet, PLEADE va inclure un système de menus définis dans un simple fichier XML. Ces menus permettront d'offrir l'interface de navigation générale du site, et l'outil sera livré avec un menu standard. Pour les pages statiques, le contenu sera affiché depuis des documents HTML, qui pourront être produits de n'importe quelle manière et déposés sur le serveur. PLEADE prendra en charge la lecture de ces documents XHTML pour les inclure dans l'interface générale de navigation. Ainsi, ajouter une page statique dans un site géré par PLEADE sera aussi simple que :

  • Ajouter une ligne telle que <item id="infos"/> dans un fichier XML

  • Créer un document XHTML nommé infos.xhtml et le déposer sur le serveur

Cette procédure simplifiée permettra à tout responsable de site PLEADE une grande souplesse dans la personnalisation du contenu statique qu'il souhaite proposer à ses utilisateurs.

3.4) Chargement et suppression des instruments de recherche

Les personnes autorisées et dûment authentifiées pourront utiliser une interface Web pour ajouter des instruments de recherche dans une installation PLEADE. L'ajout pourra se faire un document EAD à la fois ou par lots de documents EAD. Dans le cas où un administrateur ajoutera un lot de documents, le paramétrage du chargement devra être le même pour tous les documents.

Pour PLEADE, un document EAD est un document XML qui peut être associé à des ressources extérieures (le plus souvent des images numérisées qui viennent illustrer l'instrument de recherche ou les documents d'archives). Dans le cas où des documents sont associés, PLEADE permettra de charger l'ensemble des fichiers concernés depuis un fichier compressé en format ZIP qui les rassemblera.

Le processus de chargement déclenchera toutes les opérations nécessaires, en particulier l'indexation, pour que le ou les instruments de recherche soient immédiatement disponibles en consultation et en recherche. Une fonction de suppression des instruments de recherche sera également disponible, encore une fois aux personnes dûment autorisées et authentifiées. Cette suppression pourra concerner un seul document (dans ce cas, elle sera offerte lors de l'affichage de ce document) ou concerner un lot de documents, un lot étant défini par le résultat d'une recherche quelconque.

3.5) Sous-ensemble d'instruments de recherche

Nous avons déjà évoqué le fait que la DTD EAD est très générale et permet de structurer des instruments de recherche fort variés. Cette variété nécessite sûrement des adaptations dans un outil de consultation, adaptations qui concernent l'indexation et ses conséquences en recherche, la séparation en unités documentaires, l'affichage des documents, la navigation entre les différentes parties du document, etc. Par ailleurs, il peut être intéressant de créer des collections d'instruments de recherche pour les mettre en valeur de manière commune, par exemple parce qu'ils sont reliés à une même thématique, un même lieu, un même événément.

C'est pourquoi PLEADE permettra de créer des sous-ensembles d'instruments de recherche, et ces sous-ensembles pourront facilement être intégrés à l'interface générale. Le type de sous-ensembles et les sous-ensembles eux-mêmes seront bien sûr entièrement configurables par l'administrateur d'un site PLEADE.

3.6) Recherches documentaires

La recherche documentaire sera bien entendu une fonctionnalité centrale dans PLEADE. Elle aura pour objectif de fournir aux utilisateurs un accès précis et rapide à des informations par l'expression d'une requête de recherche.

Aujourd'hui, dans les outils de recherche, on retrouve habituellement deux manières d'effectuer des recherches. Une première, appelée habituellement libre ou simple, consiste à saisir un ou des mots, voire des opérateurs, et laisser l'outil effectuer la recherche et présenter correctement les résultats. Ce type de recherche sera disponible dans PLEADE, et ce depuis toutes les pages, afin d'en faciliter l'usage.

Une seconde méthode de recherche consiste à offrir à l'utilisateur un formulaire de recherche avancée, qui permet d'exprimer des critères précis, dans des champs précis, et ce d'une manière graphique (listes, boutons, etc.).

PLEADE offrira également ce genre d'interface. PLEADE offrira un ensemble de champs disponibles en recherche, peu importe le contenu des instruments de recherche qui sont indexés. Toutefois, par paramétrage, un administrateur pourra déterminer quels sont les champs qu'il désire intégrer dans son formulaire de recherche. Il pourra également offrir plus d'un formulaire de recherche, toujours par paramétrage.

Par ailleurs, lors de la consultation d'un instrument de recherche d'une grande taille, il serait intéressant d'offrir à l'utilisateur la possibilité d'effectuer une recherche à l'intérieur même de cet instrument de recherche. Cette fonctionnalité sera éventuellement intégrée à l'interface de consultation (discutée plus loin).

3.7) Présentation des résultats de recherche

La présentation des résultats de recherche représente un défi intéressant, car selon les requêtes effectuées et les types de documents indexés, différents scénarios peuvent être envisagés. Par exemple, une recherche libre permettra de retrouver plusieurs unités documentaires appartenant au même instrument de recherche.

Différents modes de présentation des résultats de recherche seront offerts, et des précisions sur ces modes seront fournis ultérieurement. Chaque résultat fera l'objet d'une notice brève ; le contenu de cette notice sera déterminé en fonction de la catégorie d'instrument de recherche sélectionnée lors du chargement.

3.8) Consultation des instruments de recherche

La consultation des instruments de recherche en format EAD est une fonctionnalité qui doit être optimisée en fonction de la structure et du type de contenu de ceux-ci. C'est pourquoi les paramètres exacts de la consultation seront déterminés par la catégorie de l'instrument de recherche, catégorie déterminée lors de son chargement.

Déjà, on peut entrevoir deux grandes approches possibles :

  • Un document EAD suffisamment petit pour être consulté en un seul bloc

  • Un document EAD d'une taille suffisante pour envisager un système de consultation en plusieurs pages et avec une navigation plus poussée

Les catégories auront également un impact sur la manière de présenter les informations contenues dans les unités de description de l'instrument de recherche. Par exemple, une unité de description avec seulement une cote, un intitulé et une date, placée au milieu de dizaines d'autres unités semblables, ne devrait pas être affichée de la même manière qu'une unité de description où on retrouve des éléments textuels plus élaborés (résumé, description du contenu, notice biographique, etc.).

Le paramétrage de la consultation se fera donc selon deux axes : la méthode de navigation (un seul bloc ou table des matières) ainsi que le type d'affichage (tabulaire, textuel, etc.). On pourrait même envisager de laisser ce choix dynamique lors de la consultation ; il s'agit d'une piste à explorer.

Une autre méthode de navigation et de consultation d'un instrument de recherche consiste à passer par des index, créés automatiquement à partir de termes d'indexation insérés dans les différentes unités de description (à l'aide des éléments persname, geogname, etc.). Lors du chargement d'un instrument de recherche, il sera possible de préciser les index à créer, et lorsqu'au moins un index sera créé il sera possible de la naviguer pour consulter le contenu de l'instrument de recherche.

3.9) Exploration des instruments de recherche

Tous les instruments de recherche créés par un service d'archives ne sont pas nécessairement indépendants. Ils peuvent être reliés parce qu'ils concernent un même producteur, un même lieu de conservation, un même thème, une même période historique, etc. C'est pourquoi PLEADE permettra aux administrateurs d'offrir des parcours dans les instruments de recherche, parcours qui seront soient prédéfinis (par exemple consulter la liste des lieux de conservation et faire une recherche pour chacun), soit à définir par l'administrateur.

Un fichier de configuration permettra de lister les parcours à offrir au sein d'une interface, parmi les parcours prédéfinis dans l'outil. Par ailleurs, les parcours personnalisés seront réalisés par la création d'un document XML qui contiendra notamment une requête de recherche qui permet d'identifier précisément les documents à insérer dans le parcours, ainsi que l'ordre de tri pour ces documents.

Bien entendu, le système de pages statiques pourra aussi être utilisé pour créer des parcours personnalisés sans passer par ce mécanisme.

4) Calendrier de réalisation et méthodologie de développement

Le développement de PLEADE sera assuré au départ par les sociétés Anaphore et AJLSM, au cours du premier semestre 2003. Ce développement utilisera les méthodes ainsi que les outils habituels des projets de développement de logiciels libres, qui peuvent se résumer ainsi :

  • Un site d'hébergement de projets de développement de logiciels libres est utilisé comme plate-forme publique de développement.

  • Un site Web, à l'adresse http://www.pleade.org, héberge les informations générales à propos du projet, la documentation, etc.

  • Les sources seront mises à disposition de tous à partir d'un entrepôt CVS, facilitant ainsi les tests de la plate-forme.

  • Des listes de discussions par courrier électronique sont en place pour faciliter les échanges et le support sur le produit.

  • Des sorties préliminaires de l'outil seront réalisées à intervalle régulier, afin de faciliter l'installation de l'outil et ainsi les tests.

Une première version préliminaire a été rendue disponible à la fin du mois de mai 2003, et d'autres suivront, en attendant la sortie officielle à l'automne.

5) Conclusion

Cette description fonctionnelle est générale et incomplète, mais elle donne une idée de l'outil qui sera créé. Selon le calendrier prévu, cet outil devrait être défini plus précisément dès l'été 2003, et surtout il pourra être testé dès cette période.


© 2003, 2004, 2005 PLEADE / AJLSM / Anaphore
Des questions ? Des remarques ? Utilisez les listes de discussions ! Vous voulez l'utiliser ? Vous pouvez le télécharger !