2 Catégories, traits et fonctions grammaticales

On détaille ici

  • le statut linguistique des nœuds de la REPRSYNTPROF, les catégories morpho-syntaxiques utilisées, les autres traits associés aux nœuds
  • les fonctions grammaticales constituant les étiquettes des dépendances

2.1 Nœuds

Les nœuds correspondent à une forme fléchie et sont étiquetés par l’identifiant d’ordre linéaire dans la phrase, une forme fléchie, un lemme, et par la catégorie syntaxique de ce lemme.

2.1.1 Traitement des mots composés et unités polylexicales

Le présent schéma d'annotation a été défini grossièrement comme si on avait un nœud par forme fléchie.

Cela dit dans son application au corpus Sequoia, nous n'avons pas modifié la tokenisation présente dans le corpus original. Or ce corpus a un traitement actuellement hybride des mots composés : les mots composés grammaticaux sont codés sous la forme d'un seul token, avec un "_" séparant les composants du composé (par exemple : "grâce_à"), mais le corpus ne contient aucun composé nominal verbal ou adjectival. Ainsi "pomme de terre" est traité avec 3 nœuds.

On a donc actuellement dans le corpus Sequoia annoté en syntaxe profonde une situation où un nœud correspond soit à une forme fléchie sémantiquement pleine (majorité des cas), soit un élément d'une unité sémantique plus large.

2.1.2 Mots considérés comme sémantiquement vides

Les mots considérés comme sémantiquement vides sont marqués comme tels (on utilise un trait « void=y »), et ne font pas partie de la ReprSyntProf. Il s'agit précisément des cas suivants :

  • il explétif (dépendance suj uniquement finale)

  • se moyen ou neutre (dépendance add.demsuj, trait diat=demsuj sur le verbe)

  • se « réfléchi intrinsèque » (dépendance aff)

  • se « vrai réfléchi ou réciproque » (qui est en surface obj ou a_obj du verbe, mais en profond cette dépendance est reportée sur le sujet du verbe)

  • se pour les constructions "se faire + infinitif" (dépendance aff), diat=caus_seobj

  • à et de prépositions régies (fonctions a_obj et de_obj respectivement)

  • par introduisant un complément d’agent (fonction finale p_obj.agt)

  • auxiliaires (relations aux.*), y compris le verbe faire dans le complexe causatif

  • le clitique ce dans les clivées

  • à et de complémenteurs introduisant une infinitive objet (fonction obj : Paul promet de se lever tôt / Paul cherche à gagner plus). NB: ils sont codés comme des prépositions dans la représentation de surface originale du FTB, et cela n'est pas modifié dans la représentation profonde.

  • que complémenteur introduisant un argument phrastique suj, obj ou de_obj (que Paul puisse penser cela m’a indignée, Paul souhaite que la réunion soit avancée, Paul se réjouit que la réunion soit annulée

  • si complémenteur introduisant une interrogative. (Paul demande si le spectacle est terminé / Paul ne sait pas si le spectacle est terminé) même si si marque le caractère interrogatif et n'est donc pas strictement vide. => on opte pour uniformiser le traitement de si et de que : on considère si vide, et en dépendances profondes, on a une dépendance directe entre le verbe enchâssant et le verbe de l'interrogative. Cependant, on note le caractère interrogatif de la subordonnée, pour différencier par exemple Paul ne sait pas que / si le spectacle est terminé.

  • le dans les tours "le cas LE plus grave", "les cas LES plus longuement débattus"

Pour les prépositions régies par une dépendance p_obj.o, on a des cas de préposition totalement vide sémantiquement (compter sur) ou bien portant une sémantique (voter pour / voter contre) => on ne distingue pas ces cas, et conserve ces prépositions dans la représentation profonde.

Par ailleurs certains clitiques ou pronoms anaphoriques sont résolus, et supprimés de la représentation profonde : c'est le cas des pronoms relatifs dont on peut repérer structurellement l'antécédent (relatives épithètes, clivées), et c'est le cas des clitiques coréférents à un syntagme disloqué (cf. Section 12.2).

2.1.3 Catégories morpho-syntaxiques

Nous retenons deux niveaux de granularité pour les catégories morpho-syntaxiques.

Le jeu de catégories grossier est exactement constitué des 13 catégories de base du FTB.

Le jeu plus fin est celui défini par Crabbé et Candito (2008). Il est construit à partir des 13 catégories de base du FTB, croisées avec le mode des verbes, et certaines distinctions apparaissant dans le trait subcat dans le FTB, soit :

  • la caractère interrogatif ou pas des adverbes, adjectifs et déterminants

  • une indication du cas des clitiques

  • le trait commun/propre pour les noms

  • la distinction conjonction de coord versus conjonction de subordination

  • des étiquettes particulières pour les amalgames préposition+déterminant (au), préposition+pronom (auquel)

La catégorie fine est donc une information redondante qui peut être obtenue à partir de la catégorie grossière et des traits.

Catégorie fine

Catégorie de base du FTB

Trait supplémentaire du FTB

Description / exemple

V

V

m=ind

verbe indicatif

VS

V

m=subj

verbe subjonctif

VINF

V

m=inf

verbe infinitif

VPP

V

m=part, t=past

participe passé

VPR

V

m=part, t=pst

participe présent

VIMP

V

m=imp

verbe impératif

NC

N

s=c | ord | card

nom commun

NPP

N

s=p

nom propre

CS

C

s=s

conjonction de subordination

CC

C

s=c

conjonction de coordination

CLS

CL

s=suj

clitique sujet

CLO

CL

s=obj

clitique objet

CLR

CL

s=refl

clitique réfléchi

P

P

préposition non amalgamée

P+D

P+D

préposition+dét : le lutin des alpages

P+PRO

P+PRO

préposition+prorel : le lieu auquel on pense

I

I

interjection

PONCT

PONCT

ponctuation

ET

ET

mots étrangers

ADJ

A

s=qual | ind | card | ord

adjectifs non interrogatifs

ADJWH

A

s=int

adjectifs interrogatifs

ADV

ADV

s=ind | neg ou pas de trait s

adverbes non interrogatifs

ADVWH

ADV

s=int

adverbes interrogatifs

PRO

PRO

s= card | dem | ind | neg | pers

pronoms ni interrogatifs ni relatifs

PROREL

PRO

s=rel

pronoms relatifs

PROWH

PRO

s=int

pronoms interrogatifs

DET

D

s= def | dem | ind | neg | part | poss | ou pas de trait s

déterminants non interrogatifs

DETWH

D

s=int

déterminants interrogatifs

PREF

PREF

préfixe

2.1.4 Traits profonds

Il s'agit de traits explicités sur le verbe lexicalement plein d'un noyau verbal comprenant éventuellement des clitiques et des auxiliaires.

Le verbe lexicalement plein est toujours le dernier verbe du noyau verbal.

On explicite :

  • dm = le mode profond : c'est le mode du premier auxiliaire (a été mangé => indicatif, fasse manger => subjonctif, être allé => infinitif, se faisant dépasser => participe présent)

  • dl = le lemme profond : incluant les clitiques figés s'ils existent (en particulier le réfléchi intrinsèque)

  • diat = la diathèse :

    • passif,

    • impers, actif impersonnel (il est arrivé trois personnes, il est surprenant que Paul soit parti),

    • passif_impers, passif impersonnel (il a été décidé de maintenir la gratuité de ce service),

    • demsuj, démotion du sujet pour le moyen et le neutre ; on ne distingue pas entre les deux (Ce plat se mange souvent froid / La branche s'est finalement cassée),

    • caust, causatif d'un verbe transitif (Paul fait soigner ses enfants par un rebouteux. Paul fait balayer la cour aux nouvelles recrues),

    • causi, causatif d'un intrans (Paul fait venir un prestidigitateur),

    • caust_seobj, se+faire+inf sans interprétation réfléchie (Paul s'est fait huer).

Pour un verbe plein, l'absence de trait diat signifie qu'il s'agit d'une diathèse canonique, forcément à l'actif.

  • cltype = le type de la proposition indiqué sur sa tête :

    • int = interrogative (percolé du complémenteur si ou bien de l'élement interrogatif antéposé)

    • imp = impérative (Que la lumière soit !)

    • excl = exclamative (Qu'il est beau! ou Comme ils sont bêtes! ou De quelle audace elle a fait preuve!)

L'absence de trait cltype sur la tête d'une propostion signifie que celle-ci est déclarative.

2.1.5 Autres traits

Traits de genre, nombre, personne, mode (non profond), temps grammatical, personne + quelques autres informations :

Trait

Signification

Commentaire

g=f

genre=féminin

g=m

genre=masculin

m=imp

mode=impératif

redondant avec cat=VIMP

m=ind

mode=indicatif

redondant avec cat=V

m=inf

mode=infinitif

redondant avec cat=VINF

m=part

mode=participe

redondant avec cat=VPP | VPR

m=subj

mode=subjonctif

redondant avec cat=VS

n=p

nombre=pluriel

n=s

nombre=singulier

p=1

personne=1

p=2

personne=2

p=3

personne=3

s=c

nom commun

redondant avec cat=NC

s=card

cardinal NC,A,D or PRO

s=def

defini DET or P+D

s=dem

demonstratif DET or PRO

s=ind

indefini DET, ADJ or PRO

s=int

interrogatif PROWH, ADJWH, DETWH, ADVWH

s=neg

negatif ADV, PRO, DET, NC (pour non)

s=obj

clitique objet réfléchi ou pas

s=ord

adjectif ordinal

s=p

nom propre

redondant avec cat=NPP

s=part

déterminant partitif

s=pers

pronom personnel

s=poss

possessif DET, PRO

s=qual

adjectif qualificatif

s=refl

clitique réfléchi

redondant avec cat=CLR

s=rel

pronom relatif (PROREL ou P+PRO)

s=s

conjonction de subordiantion et ponctuation de fin de phrase

systématique pour cat=CS

s=suj

clitique sujet

redondant avec cat=CLS

s=w

ponctuation interne à une phrase

t=cond

temps=conditionnel

t=fut

temps=futur

t=impft

temps=imparfait

t=past

temps=passé simple | participe passé

t=pst

temps=présent

2.2 Fonctions grammaticales

Les fonctions grammaticales représentent un typage des réalisations syntaxiques des arguments, telles qu'observées dans des diathèses finales. Le fait d'utiliser la même étiquette SUJ pour un sujet canonique ou un sujet final est que lorsque le sujet canonique est employé dans une diathèse canonique (i.e. sans redistribution), alors il a toutes les propriétés du sujet final. Ainsi par exemple, le sujet canonique du passif, i.e. le p_obj.agt final, a toutes les propriétés d'un sujet lorsque le même verbe est employé à l'actif.

La plupart des fonctions peuvent être aussi bien canonique que finale, mais par exemple p_obj.agt ne peut être que finale (et correspond toujours à un sujet canonique), et argc (l'argument causateur du causatif) ne peut être que canonique (ce qui constitue un cas limite, cf. du coup on n'observe jamais argc dans une sous-catégorisation finale. Il est défini uniquement par la propriété de redistribution causative : c'est le sujet final dans une diathèse causative).

En outre seules quelques fonctions peuvent liées par des redistributions : suj, obj, a_obj, de_obj, p_obj.agt, argc. Toutes les autres fonctions sont systématiquement finale et canonique (et notées par commodité par un label simple).

Nous allons lister ici toutes les fonctions grammaticales utilisées en représentation syntaxique profonde, mais également celles utilisées uniquement en représentation de surface.

Nous utilisons premièrement les fonctions grammaticales à gouverneur verbal définies dans le FTB (Abeillé, 2004), avec cependant des distinctions au sein des fonctions mod et p_obj. On reprend ainsi exactement les fonctions suj, obj, ats, ato, a_suj et de_obj, telles que définies dans le FTB.

La fonction p_obj du FTB est subdivisée en :

  • p_obj.agt pour un complément d’agent,

  • p_obj.o pour les autres dépendants sous-catégorisés, dont la prep est fixée, et qui ne sont ni a_obj, ni de_obj

La fonction mod est subdivisée en diverses sous-fonctions énumérées par le tableau ci-dessous.

Nous étendons l’utilisation de ces fonctions dans deux cas non annotés dans le FTB :

  • les dépendants dans une participiale passée
  • les dépendants adverbiaux réduits à un seul mot comme dans ils sont là.

On ajoute par ailleurs les relations aux.caus, aux.pass, aux.tps pour les auxiliaires, et aff pour les clitiques figés.

La dépendance vers le clitique se a comme étiquette :

  • soit une fonction obj ou a_obj quand le clitique a effectivement un sens réfléchi ou réciproque,

  • soit la fonction aff pour les verbes essentiellement pronominaux,

  • Soit la fonction aff.demsuj pour le moyen ou le neutre, qui ne sont pas distingués l'un de l'autre .

On ajoute également une fonction finale dis pour les dépendants disloqués (cf. manquant dans le guide FTB, cf. p.c. d'Anne Abeillé), qui portent par ailleurs comme étiquette canonique la fonction canonique de leur clitique coréférent (voir Section 12.2).

Pour les gouverneurs adjectivaux, on précise la fonction de leurs dépendants, cf. l'objectif d'obtenir la sous-catégorisation canonique complète des adjectifs.

Pour Paul est enclin à la mélancolie, l'adjectif enclin a Paul pour sujet canonique, et la mélancolie pour a_obj canonique.

Pour les dépendants d’autres catégories de gouverneur, on précise ou pas la fonction grammaticale du dépendant, selon que cette fonction est directement prédictible d’après la position syntaxique et la catégorie du dépendant et du gouverneur :

C’est le cas pour un déterminant (=> fonction det), un adjectif épithète (=> fonction mod), une relative adnominale (=> fonction mod.rel).

Par contre, on utilise une fonction sous-spécifiée dep pour les cas où il faudrait faire appel à une notion de sous-catégorisation du gouverneur, non directement accessible. C’est en particulier le cas pour les prépositions dépendant de gouverneurs ni verbaux ni adjectivaux ni adverbiaux: autrement dit, on ne gère pas la distinction argument/ajout pour les dépendants prépositionnels des noms.

Rem: les fonctions de la forme XXX.YYY sont interprétables comme des sous-types de la fonction XXX

Dans le tableau ci-dessous, on note :

  • en rouge les fonctions qui n'apparaissent que sur des mots sémantiquement vide et/ou uniquement comme fonction finale, et donc uniquement dans la représentation de surface
  • en bleu les fonctions qui n'apparaissent que dans la représentation profonde
  • en noir les fonctions pouvant apparaître dans les deux

Par ailleurs, on indique également les quelques différences entre le schéma de représentation de surface du FTB et le schéma de représentation de surface du Sequoia : les fonctions mod et p_obj ont en effet été précisées. On note cela en fournissant entre crochets l'équivalent FTB.

FonctionCatégorie possible pour le gouverneurPossible comme fonction FINALE ? Possible comme fonction CANONIQUE ?Définition / commentaire
_Vnonouifonction canonique vide portée par le sujet final il explétif d'une construction impersonnelle
affVouinonpour un clitique figé et le clitique se ni réfléchi ni réciproque
aff.demsujVouinonfonction du clitique se par rapport au verbe pour exprimer le neutre ou le moyen
argPouioui

Utilisée dans le cas de prépositions « liées » : dans de Charybde en Scylla, en Scylla est dépendant de type arg de la première préposition de

argcVnonouifonction uniquement canonique : pour l'argument causateur dans les constructions causatives
arg.compADJ, ADVnonouirelation d'une comparative avec son gouverneur qui est un adverbe ou adjectif exprimant la comparaison
arg.consADJ, ADVnonouirelation d'une consécutive avec son gouverneur adverbial ou adjectival
atoVouiouiattribut de l'objet
atsVouiouiattribut du sujet
aux.causVouinonauxiliaire du causatif ou du complexe se faire + inf
aux.passVouinonauxiliaire du passif
aux.tpsVouinonauxiliaire de temps
a_objV, ADJouiouicomplément indirect non locatif introduit par à
coordtout typeouiouirelation portée par un coordonnant, avec comme gouverneur le premier conjoint
depADJ, D, ET, N, PROouiouirelation sous-spécifiée, pour les dépendants prépositionnels de gouverneurs non verbaux et non adjectivaux (pas de gestion de la distinction argument / ajout pour ces cas)
dep.coordCCouiouirelation portée par un coordonné (sauf le premier), avec comme gouverneur le coordonnant immédiatement précédent
detADJ, ADV, N, PROouiouidéterminant
de_objV, ADJouiouicomplément indirect non locatif introduit par de

dis

[n'existe pas dans le FTB]

Vouinonfonction uniquement finale, pour les dépendants disloqués (apparaissant en tête ou fin, avec un clitique de reprise : Paul, sa moto, il l'a cassée).
modtout typeouioui

modifieur de gouverneur verbal ou adjectival

modifieur, autre qu'une relative, d'un autre type de gouverneur pour peu que l'on puisse repérer structurellement qu'il s'agit d'un modifeur (adjectif épithète par exemple)

mod.app

[équivalent FTB: mod]

ADJ, N, PROouiouiapposition à un groupe nominal

mod.cleft

[équivalent FTB: mod]

Vouiouila subordonnée dans le cas d’une clivée
mod.compADJ, ADV, N, P, PRO, Vouiouimodifieur introduisant une comparaison

mod.inc

[équivalent FTB: mod]

ADJ, CC, CS, N, P, Vouiouiproposition incise
mod.relADJ, ADV, N, PROouiouidépendance d'une relative par rapport à son antécédent
mod.rel.partNnonouidépendance de la tête nominale d'une relative avec ellipse introduite par dont par rapport à l'antécédent
mod.superADJ, ADV , Nnonouimodifieur exprimant le superlatif
mod.vocVouiouivocatif
objVouiouiobjet de verbe

obj.cpl

CS

oui

oui

objet de complémenteur

obj.pPouiouiobjet de préposition
poncttout typeouioui

relation portée par tout dépendant typographique, sauf pour les virgules jouant le rôle de coordonnant (qui porte la relation coord)

p_obj.agt

[équivalent FTB: p_obj]

Vouinonfonction uniquement finale : complément d’agent en par ou de en cas de passif, ou en par dans le cas de causatif

p_obj.o

[équivalent FTB: p_obj]

V, ADJouiouicomplément indirect du verbe ou de l'adjectif autre
sujV, ADJouiouisujet d'un verbe ou d'un adjectif