3. 2. Codage du corpus

Tout d’abord, en ce qui concerne les antécédents N1 et N2, sont codées l’animation (animé, non-animé) et la présence ou non d’un modifieur (adjectif, adverbe). Pour un GN complexe contenant un de N non génitif, comme dans l’homme de confiance d’un chevalier, je considère que l’homme est N1 modifié par de confiance et que un chevalier est N2.

Sont exclues les phrases où l’antécédent de la relative appartient à une structure « N1 de N2 », mais où il s’agit de noms composés comme pomme de terre ou bien de relations de substance (le pull de coton, cf. Gilboy et al., 1995) ou de quantité (le verre d’eau), mais aussi les cas où N1 est un quantificateur (le groupe de gamins, aussi exclu dans l’analyse de Kister, 2002) ou quand le GN contient une date (la loi de 1957).

Comme l’analyse porte sur les relatives non restrictives, il faut contrôler cet aspect dans les phrases retenues. Les relatives précédées d’une marque de ponctuation sont considérées comme non restrictives, tout comme celles qui peuvent être supprimées sans gêner la compréhension.

En ce qui concerne la forme des expressions référentielles (p. ex. définitude), les antécédents sont codés comme défini, indéfini, démonstratif ou possessif selon l’article qui les précède et les noms propres sont codés comme tels. Un nom de pays, un acronyme désignant une organisation ou un groupe sont codés comme des noms propres et non-animés.

La fonction syntaxique de N1 est codée en partie d’après la classification de Givón (ch. 20, 1990), avec trois catégories : sujet, objet direct et « OI et obliques ». J’ajoute une autre catégorie que j’appelle « sans fonction ». Quand la structure « N1 de N2 » est dans une incise (65), s’il s’agit d’une phrase sans verbe (66) ou bien d’une apposition, j’assigne à N1 la catégorie « sans fonction ».

(65)Ceux-ci envoient alors trois véhicules blindés et des camions militaires remplis de manifestants vers le siège d’Ostankino - principale source d’information des Russes, à laquelle l’opposition n’avait plus accès.

(66)Deux entretiens de Philip Roth, qui, dans l’un, s’interroge sur lui-même, dans l’autre, s’adresse à Primo Levi, chimiste, industriel, romancier, qui vient de mourir.

L’attachement de la proposition relative est identifié par l’accord en genre et nombre entre l’antécédent et le relativiseur (lequel, auquel) et le verbe de la relative (qui, à qui). Le caractère animé de à qui permet aussi d’établir l’attachement si un seul antécédent est animé. Sinon, le contenu sémantique de la phrase suffit à établir l’attachement et aucun cas ambigu n’est répertorié. La ponctuation au début de la relative ainsi que la longueur de cette dernière sont aussi annotées.