Cette section détermine, pour le document EAD à publier, les unités de recherche.Il est essentiel de lire la section sur les unités dans PLEADE pour comprendre cette section du formulaire de publication.
Pour tout document EAD publié, on aura toujours au moins trois unités de recherche : l'une rassemblera les informations bibliographiques sur le document EAD (elle sera produite à partir de l'élément eadheader du document EAD) ; la deuxième sera formée à partir de l'élément archdesc (description globale du corpus de documents et élément dsc avec ses sous-éléments si ceux-ci ne sont pas eux-mêmes retenus comme l'objet d'une fragmentation) ; la troisième sera le document EAD entier.
Ces trois unités de recherche seront complétées par un nombre en général important d'autres unités de recherche, correspondant à des composants de l'instrument de recherche jugés pertinents par le responsable de la publication.
Imaginons deux scénarios aussi réalistes que possible :
supposons que l'on dispose, comme document EAD, d'un inventaire analytique ou d'un catalogue, dans lequel les pièces d'un corpus d'archives sont précisément décrites et indexées. C'est essentiellement dans les unités documentaires correspondant à ces pièces que se trouvent les blocs d'informations intéressants pour l'utilisateur. Si, dans le document EAD, ces unités documentaires sont des éléments cnumérotés ou non, possédant un attribut level dont la valeur est item (pièce), on pourra choisir, dans le formulaire de publication PLEADE, de fragmenter l'instrument de recherche en fonction du niveau archivistique item, et on tapera donc : |item| dans le formulaire de publication. De cette façon, si par la suite, à l'aide d'un formulaire de recherche adapté à ce cas, on lance par exemple une recherche sur un descripteur géographique (élément geogname) utilisé pour indexer une ou plusieurs pièces, PLEADE retournera directement, dans la liste de résultats, les unités documentaires décrivant chacune des pièces ainsi indexées.
Dans la version 2 de PLEADE, a été ajoutée une méthode qui permet de ne prendre en compte dans le processus de fragmentation uniquement les unités documentaires correspondant aux fiches de niveau bas et aux fiches de parties d'articles telles que saisies avec le logiciel Aide au classement. On pourra en utilisant cette méthode, atteindre le même objectif, sans se préoccuper de savoir si on a spécifié un niveau de description archivistique dans ces fiches, et si oui, lequel.
supposons que l'on dispose (cas fréquent) d'un répertoire numérique fortement hiérarchisé et de profondeur irrégulière, dans lequel les informations utiles sont réparties entre plusieurs niveaux hiérarchiques, ces niveaux hiérarchiques ne correspondant pas toujours au même niveau archivistique (des dossiers pouvant se trouver décrits directement au sein d'une série, tandis que plus loin dans l'instrument de recherche, d'autres dossiers font partie d'une sous-sous-série), et les attributs level des éléments c n'étant pas toujours renseignés. Il pourra dans ce cas être plus pertinent de choisir de fragmenter selon le niveau hiérarchique. Si on tape : |3h|4h| dans le formulaire de publication, on indique en fait que l'on souhaite que PLEADE fragmente le document EAD en unités documentaires correspondant aux éléments c situés aux 3e et 4e niveaux hiérarchiques, en comptant comme premier niveau le niveau de description global (éléments fils de archdesc à l'exclusion de dsc). Ceci signifie que les composants situés au 2e niveau hiérarchique ne formeront pas de fragment, ni ceux situés aux 5e ou 6e niveaux s'il y en a. Ils ne seront pas directement cherchables.
Une autre option de fragmentation, très simple, consisterait à choisir de fragmenter en autant d'unités qu'il y a d'éléments c. Cette méthode produirait plus d'unités documentaires cherchables, mais il est possible que pour certains instruments de recherche le contenu de certaines unités documentaires soit réduit à peu de chose, comme un intitulé et des cotes extrêmes, ce qui ne constitue pas un bloc d'informations très riche.
Dans tous les cas il importe de bien connaître la structure du document EAD pour réaliser une fragmentation intéressante. Les outils d'édition de documents XML dont chacun dispose permettront de visualiser cette structure de diverses façons. Un éditeur XML comme XMetaL la présentera souvent sous la forme d'un arbre. Un SGBD comme Aide au classement permettra d'imprimer les titres saisis dans le plan de classement, et de s'en servir pour compter les niveaux hiérarchiques ; dans ce cas on n'oubliera pas
que le niveau de description global (correspondant à la fiche descriptive de haut niveau, dite "chapeau" ou "super chapeau" dans Aide au classement) est le premier niveau hiérarchique pour le logiciel PLEADE, ce qui veut dire que les titres "de niveau 1" dans Aide au classement correspondent au niveau hiérarchique 2 (|2h| dans le formulaire) selon PLEADE ;
qu'il ne faut pas oublier de compter au moins un niveau hiérarchique supplémentaire "en-dessous" des titres de dernier niveau dans Aide au classement : celui correspondant aux fiches descriptives de bas niveau.
Finalement un navigateur Web comme Mozilla ou Internet Explorer sera également très utile pour examiner le document EAD à publier, notamment parce qu'il fournit une représentation pliable de l'arbre XML formé. Pour utiliser un tel navigateur à cet effet, il faudra néanmoins s'assurer que les fichiers composant la DTD EAD sont stockés dans le même dossier que le document EAD à examiner.