1.1.3.3 Bases de données et corpus

Plusieurs bases de données ont été constituées grâce aux missions effectuées, tant du point de vue linguistique qu’anthropologique.

Les données linguistiques

Les données linguistiques ont été entrées dans une base de données Filemaker, exploitant un modèle anciennement réalisé par Joël Brogniard (ingénieur informatique) pour le laboratoire DDL. Ce modèle permet de faire des recherches détaillées et complexes, d’une part, sur les unités phonétiques (consonnes, voyelles, tons) et, d’autre part, sur les thèmes et catégories sémantiques.

A titre d’exemple, il permet de lister tous les mots possédant la voyelle [o] en V1 avec un ton H et une consonne [mb] en C2. De même, il est possible de demander tous les éléments de la catégorie correspondant aux mammifères (infra) ; demande qui peut également être couplée avec une restriction de présence d’un [t] en position initiale, par exemple. Plusieurs critères peuvent donc être croisés.

Ce logiciel et ce modèle ont donc été choisis parce qu’ils donnaient la possibilité d’effectuer de nombreuses recherches fines, simples ou complexes (faisant intervenir plusieurs restrictions) et ceci à plusieurs niveaux : phonétiques et thématiques.

Les thématiques (ou catégories grammaticales) suivantes ont été retenues :

01 Récolte du miel ; 02 Tradition (hutte, hache) ; 03 Pêche ; 04 Chasse ; 05 Mammifères ; 06 Musique, rites, religion ; 07g Botanique, arbres ; 07b Plantes, lianes, champignons ; 07c Fruits, légumes ; 08g Animal, partie du corps animal ; 08a Oiseau, volant ; 08b Poisson ; 08c Insectes (=6 pattes), invertébrés (différent de reptiles) : bestioles ; 08d Serpents, amphibiens (grenouille, salamandre), crabe ; 09 Parenté ; 10 Pensée, abstrait ; 11 Humain, partie du corps ; 12 Autres, générique ; 13 Santé, maladie, remèdes ; 14 Lieu, espaces, mobilité ; 15 Particule ; 20 Verbes (actions, états).

Une entrée peut relever de plusieurs catégories. L’entrée ‘abeille’, par exemple, a été codée 01 et 08c.

Par ailleurs, le masque de saisie a également permis d’entrer les termes du proto-gbaya (PG) et du proto-bantu (PB) disponibles, afin de situer rapidement les formes collectées d’un point de vue diachronique. Chaque fiche comporte également une partie ‘commentaires’. Les différentes fiches peuvent être exportées de Filemaker sous Excel pour établir une liste rapidement exploitable comme celle présentée en annexe .

Certaines listes de lexiques spécialisées ou de base ont fait l’objet d’enregistrements audio (maladie, verbes, etc.) mais n’ont pas été intégrées dans le présent document.