Automatic Period Segmentation of Oral French ; Segmentation automatique en périodes pour le français parlé
In: Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 :, 2020
Online
Konferenz
Zugriff:
Natural Language Processing in oral speech segmentation is still looking for a minimal unit foranalyze. In this work, we propose a comparison of two methods of automatic segmentation in macrosyntactic periods which allows to take into account syntactic and prosodic components of speech. Wecompare the performances of an existing tool Analor (Avanzi et al., 2008) developed for automaticsegmentation of prosodic periods and of CRF models relying on syntactic and / or prosodic features.We find that Analor tends to divide speech into smaller segments and that CRF models detect largersegments than macro-syntactic periods. However, in general CRF models perform with better resultsthan Analor in terms of F-measure. ; Nous proposons la comparaison de deux méthodes de segmentation automatique du français parlé en périodes macro-syntaxiques, qui permettent d’analyser la syntaxe et la prosodie du discours. Nous comparons l’outil Analor (Avanzi et al., 2008) qui a été développé pour la segmentation des périodes prosodiques et les modèles de segmentations utilisant des CRF et des traits prosodiques et / ou morphosyntaxiques. Les résultats montrent qu’Analor divise le discours en plus petits segments prosodiques tandis que les modèles CRF détectent des segments plus larges que les périodes macro-syntaxiques. Cependant, les modèles CRF ont de meilleurs résultats qu’Analor en termes de F-mesure.
Titel: |
Automatic Period Segmentation of Oral French ; Segmentation automatique en périodes pour le français parlé
|
---|---|
Autor/in / Beteiligte Person: | Kalashnikova, Natalia ; Eshkol-Taravella, Iris ; Grobol, Loïc ; Delafontaine, François ; Laboratoire Ligérien de Linguistique (LLL) ; Bibliothèque nationale de France (BnF)-Université d'Orléans (UO)-Université de Tours (UT)-Centre National de la Recherche Scientifique (CNRS) ; Modèles, Dynamiques, Corpus (MoDyCo) ; Université Paris Nanterre (UPN)-Centre National de la Recherche Scientifique (CNRS) ; Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice) ; Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Sciences et Lettres (PSL)-Département Littératures et langage - ENS Paris (LILA) ; École normale supérieure - Paris (ENS-PSL) ; Université Paris Sciences et Lettres (PSL)-Université Paris Sciences et Lettres (PSL)-École normale supérieure - Paris (ENS-PSL) ; Université Paris Sciences et Lettres (PSL) ; Laboratoire de Linguistique Formelle (LLF - UMR7110) ; Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité) ; Benzitoun, Christophe ; Braud, Chloé ; Huber, Laurine ; Langlois, David ; Ouni, Slim ; Pogodalla, Sylvain ; Schneider, Stéphane |
Link: | |
Zeitschrift: | Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 :, 2020 |
Veröffentlichung: | HAL CCSD ; ATALA ; AFCP, 2020 |
Medientyp: | Konferenz |
Schlagwort: |
|
Sonstiges: |
|