7.1.1.3 La classification de type thesaurus

Pourquoi avoir fait également une recherche à partir d’un thesaurus 451 ? Les raisons, pour ne pas nous répéter, sont essentiellement les mêmes qui nous ont conduis à consulter la CDU.

Il est donc admis que la consultation préliminaire d’un langage classificatoire du type thesaurus met, au départ, le terminologue en face d’un réseau sémantique au moyen d’un ensemble d’identificateurs de classe 452 , les descripteurs et les non-descripteurs 453 , qui aideront à la première phase de structuration terminologique, c’est-à-dire à l’indexation et à la caractérisation du contenu de documents.

Le thesaurus, comme les terminologies, est composé de listes de termes de différents discours spécialisés. En effet, un thesaurus peut aider le terminologue à délimiter et à organiser l’ensemble lexical d’un domaine ainsi qu’à établir un système de renvois entre termes plus efficace et plus précis.

Il est donc manifeste que le thesaurus n’est pas une classification du type CDU. L’AFNOR définit thesaurus 454 comme étant un vocabulaire, contrôlé et dynamique, de termes ayant entre eux des relations sémantiques et génériques et qui s’applique à un domaine particulier de connaissances.Pour B. de Bessé (2000 :189), le thesaurus est une “liste de mots ou d’expressions du langage naturel groupées par affinité sémantique ou accompagnés d’indications de relations. Cette liste est organisé de manière conceptuelle et normalisée”. Il peut donc être organisé par domaines de connaissance ou par facettes, il peut même être complété par des codes pour rendre plus simples les éléments d’interrogation sur plusieurs langues (Normes ISO 3788 et 5964).

Le thesaurus est un langage contrôlé à structure combinatoire : il est structuré à partir de relations du type hiérarchique, d’équivalence et associatif. Le thesaurus, contrairement à une terminologie, n’a pas comme objectif de répertorier l’ensemble des dénominations caractéristiques d’un domaine, mais de proportionner un certain nombre d’éléments indicateurs qui permettront à l’utilisateur d’accéder d’une manière efficace à l’information 455 recherchée.

Notes
451.

Le thesaurus utilisé est le thesaurus Thelyce (du CNDP) qui a comme base bibliographique d’autres thesaurus, entre autres, le thesaurus de l’U.N.E.S.C.O, le macrothesaurus de l’O.C.D.E., le thesaurus du Management et de l’Économie. Les termes y sont repartis en onze domaines divisés en quatre vingt-douze champs sémantiques. Il s’agit d’une classification fermée et se présente par schémas fléchés (cf. Annexe Y - classifications utilisées).Il existe aussi la définition du descripteur. Exemple : 150-Pollution : dégradation d’un milieu par l’action d’agents extérieurs polluants (physiques, chimiques, biologiques, sociaux).

452.

Les termes d’indexation qui sont fondamentalement des noms ou des syntagmes.

453.

On peut également les désigner comme des termes et des non-termes. Les descripteurs sont des termes préférentiels (univoques), les non-descripteurs sont les synonymes et l’ensemble des relations d’équivalence. Il y a indexation par : terme générique (TG), terme spécifique (TS), terme associé (TA), équivalent (EP) qui constituent l’environnement sémantique du descripteur. Les relations sémantiques sont des relations d’équivalence (synonymes, etc.), de subordination (TG/TS) et associatives.

454.

Il est bon de rappeler que jusqu’à ce siècle le thesaurus était synonyme de dictionnaire. En 1957 H. Browson utilise le terme pour désigner le langage documentaire pour l’indexation de documents.

455.

Ce système veut échapper au trop plein de spécificités qui provoqueraient du bruit dans la recherche. Par exemple, dans un thesaurus ne donnera la définition d’un terme que quand il s’avère strictement nécessaire.