(JRM) Wmatrix, Sketch Engine et Laughter : méthode semi-automatique pour détecter la prosodie sémantique dans les TED Talks
Anastasia Buturlakina  1@  
1 : Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus  (CLILLAC-ARP (URP_3967))  -  Site web
Université de Paris : URP_3967
Université Paris Diderot, Bât. Olympe de Gouges, case postale 7046, 75205 Paris CEDEX13 -  France

L'avènement de la linguistique de corpus a ouvert la voie aux études des phénomènes collocationnels (Sinclair, 1998), dont l'un est la prosodie sémantique. L'objectif de cette communication est de proposer une méthode semi-automatique pour la détection de la prosodie sémantique dans le corpus des TED Talks. Selon Louw (1993 : 30), la prosodie sémantique est une aura de sens transmise au mot par ses collocats. Bent on a une prosodie sémantique négative parce qu'il est généralement suivi par les noms à connotation négative : revenge, mischief, villainy (Louw, 1993 : 38). Dans bent on self-improvement cette prosodie sémantique négative est transgressée par self-improvement qui a une connotation positive, ce qui crée un effet humoristique. Souvent caractérisée comme cachée au locuteur (Louw, 1993, Tognini-Bonelli, 2001, Hunston, 2001, 2002, Partington, 2004, McEnery, Xiao et Tono, 2006), la prosodie sémantique d'une lexie devient visible dans les concordances. La question de la détection automatique de ce phénomène dans le corpus, sans lexie de départ, date de deux décennies (Berber-Sardinha, 2000 : 107). Nous contribuons à donner une réponse partielle, en proposant une méthode semi-automatique de la détection de la prosodie sémantique, en partant de sa transgression humoristique.

Nous combinons l'annotation sémantique USAS de Wmatrix (Rayson et al., 2004) aux requêtes CQL dans Sketch Engine (Killgarriff et al., 2014) pour identifier de l'humour dont la source possible est la transgression de la prosodie sémantique. L'indicateur du rire du public, présent dans les retranscriptions des TED Talks, et les mots étiquetés comme les émotions, considérés comme un cas particulier des mots connotés, servent des points de repère. Les cas de la transgression humoristique de la prosodie sémantique comprennent cheery about failing, created artificial stupidity et big happy, nervous, uncomfortable family, cheery, create et big happy family possèdent des prosodies sémantiques positives, tandis que failing, stupidity, nervous et uncomfortable, négatives. Ainsi, la méthode par Wmatrix permet de détecter les nouvelles prosodies sémantiques. L'analyse des résultats met en évidence plusieurs autres procédés linguistiques qui renforcent l'effet humoristique induit par la transgression de la prosodie sémantique et amène à leur catégorisation.

Le travail décrit sert d'étude pilote pour la thèse, où nous nous focalisons sur l'analyse contrastive de l'humour lié à la prosodie sémantique entre le français traduit et l'anglais original, entre le français original et l'anglais, et entre le français traduit et le français original dans les TED Talks.

Berber Sardinha, T. (2000). Semantic prosodies in English and Portuguese: A contrastive study. Cuadernos de filología inglesa, vol. 9, 2000.

Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press.

Kilgarriff, A., Baisa, V., Bušta, J., Jakubícek, M., Kovᡡr, V., Michelfeit, J., Rychlý, P., Suchomel, V. (2014): The Sketch Engine: ten years on. In Lexicography 1(1): 7–36.

Kübler, N., & Volanschi, A. (2012). Semantic prosody and specialised translation, or how a lexico-grammatical theory of language can help with specialised translation (pp. 105-135). Amsterdam/Philadelphia: John Benjamins.

Louw, B. (1993). Irony in the text or insincerity in the writer? The diagnostic potential of semantic prosodies. Text and technology: In honour of John Sinclair, 240, 251.

Partington, A. (2004). “Utterly content in each other's company”: semantic prosody and semantic preference. International Journal of Corpus Linguistics 9(1), 131–156.

Rayson, P., Archer, D., Piao, S. L., McEnery, T. (2004). The UCREL semantic analysis system. In proceedings of the workshop on Beyond Named Entity Recognition Semantic labelling for NLP tasks in association with 4th International Conference on Language Resources and Evaluation (LREC 2004), 25th May 2004, Lisbon, Portugal. Paris: European Language Resources Association, pp. 7-12.

Sinclair, J. (1998). The lexical item. Amsterdam Studies In The Theory And History Of Linguistic Science Series 4, 1-24.

Tognini-Bonelli, E. (2001). Corpus Linguistics at Work. Amsterdam: John Benjamins.

Xiao, R., & McEnery, T. (2006). Collocation, semantic prosody, and near synonymy: A cross-linguistic perspective. Applied linguistics, 27(1), 103-129.



  • Poster
Personnes connectées : 1 Vie privée
Chargement...