Annotations syntaxiques sur corpus : enjeux et perspectives
le 14 mars 2015 8h30-13h
Matinée organisée par JEANNE-MARIE DEBAISIEUX (UMR 8094 - LATTiCe, Paris 3) Cycle des samedis de l’Ecole Doctorale 268 « Langage et langues »
Programme
8h30 : Accueil
9h - 10h20 : BAS AARTS (University College London) : Syntactic corpus annotation : the case in favour.
10h20 - 11h : SOPHIE PREVOST (UMR 8094 - LATTiCe, ENS/Paris3) : Annotation de textes anciens.
11h - 11h15 : Pause café
11h20 -12 h : SYLVAIN KAHANE (PUMR 7114 - MoDyCo, Université Paris Ouest Nanterre -La Défense) : Annotation de corpus oraux : de l’annotation manuelle à l’annotation automatique.
12h - 12h40 : ISABELLE TELLIER (UMR 8094 - LATTiCe, Université Sorbonne Nouvelle - Paris 3) : Apprentissage automatique d’annotations.
Présentation
La constitution de ressources de grande taille en linguistique de corpus a entraîné le développement d’outils nouveaux de traitement semi-automatiques pour leur enrichissement par des annotations qu’il était devenu impossible de faire à la main. La journée sera consacrée aux méthodologies d’annotations de type syntaxique et aux différents types d’exploitation que peut en faire le linguiste. Les possibilités de recherches qu’offrent les corpus annotés seront illustrées par des travaux anglo-saxons, riches d’une longue expérience en ce domaine. La conférence d’ouverture du Prof. Bas Aarts (University College London) montrera ainsi par des exemples précis l'apport des recherches sur corpus annotés au développement de la théorie linguistique. Seront abordées ensuite les avancées et les difficultés que présente l’annotation syntaxique de corpus de français non standard. La communication de Sophie Prévost (LATTiCe) portera sur la méthodologie d’annotation d’un corpus de langue ancienne le Syntactic Reference Corpus of Medieval French SRCMF et les possibilités de renouveau des études syntaxiques qu’apporte un tel outil. Sylvain Kahane (MoDyCo) exposera les difficultés d’établir un système d’annotation reflétant la spécificité des corpus oraux et les problèmes techniques qu’implique le passage d’une annotation manuelle (projet Rhapsodie) à une annotation semi-automatique (projet Orfeo). La communication d’Isabelle Tellier (LATTiCe) montrera comment les systèmes d’apprentissage permettent de développer des annotations existantes.
Type :
Conférence
Lieu(x) :
DiFLE, Centre Sorbonne, 46 rue Saint-Jacques, 75005 – 3e étage, salle M