Corpus Multilingue « GRAFE » – anglais, français, espagnol, grec, roumain

Projet inter-laboratoires financé par le PRES Limousin Poitou-Charentes pour la période juin 2013-juin 2015.

Responsables scientifiques et laboratoires d’appui : Raluca Nita, Université de Poitiers, Laboratoire FoReLL E.A. 3816 et Ramon Marti Solano, Université de Limoges, Laboratoire FRED E.A. 6311.

Participants au projet : 4 EC et 1 doctorante de l’Université de Poitiers (Joasha Boutault, Hélène Chuquet, Raluca Nita, Freiderikos Valetopoulos, Jeanne Vigneron), 1 EC de l’Université de Limoges (Ramon Marti Solano), 1 EC de l’Université de Tours (Manuel Torrellas), 1 EC de l’Université de Chypre (Efi Lamprou).

 

Description

Le projet a visé la constitution d’un corpus multilingue anglais, français, espagnol, grec et roumain comparable (originaux dans plusieurs langues) et parallèle (originaux et traductions), représentant deux genres textuels distincts (littéraire et scientifique), afin de permettre la mise en commun et l’exploitation de la diversité des compétences scientifiques des chercheurs des deux laboratoires impliqués. A l’intérieur de l’équipe A et dans le cadre de l’Axe Contrastivité inter-langues, le projet de corpus multilingues renoue avec le travail de constitution et d’alignement de corpus littéraires et journalistiques (anglais, français, allemand) concrétisé par le corpus PLECI (Poitiers-Louvain Echange de Corpus Informatisés) compilé entre 1999 et 2007 conjointement par l’équipe A (axe contrastivité) du laboratoire FoReLL et le CECL (Centre for English Corpus Linguistics) de l’Université Catholique de Louvain, Belgique, sous la responsabilité d’Hélène Chuquet (Poitiers) et de Sylviane Granger (Louvain).

 

Caractère innovant du projet

La diversité des langues impliquées et les deux supports discursifs différents constituent les points d’originalité de ce corpus, dans un contexte où les corpus bilingues/multilingues posent des difficultés de constitution lorsqu’il s’agit de prendre en compte des langues autres que l’anglais et le français et des types de discours différents.

La spécificité du Corpus Littérature (Lit) est de réunir des textes originaux et leurs traductions dans les 5 langues, intégrant le roumain, le grec pour lesquelles on dispose de peu de données traduites.

L’originalité du Corpus Linguistique (Ling) – qui regroupe des textes provenant d’ouvrages dans le domaine de la linguistique, avec originaux en français, anglais, et traductions en anglais, français et espagnol – est de proposer à l’étude un support discursif peu exploité jusqu’à présent dans la recherche contrastive en raison des difficultés de collecte de ce type de données. L’orientation vers des textes du domaine de la linguistique (d’approches théoriques différentes) présente un intérêt métalinguistique original, d’analyse du discours des linguistes par des linguistes, dans une optique de comparaison des langues, et, partant, des approches.

 

Déroulement du projet

à Constitution du Corpus GRAFE (juin 2013-juillet 2015) : numérisation et océrisation de 180 extraits pour le Corpus littéraire et de 57 extraits pour le Corpus linguistique, toilettage.

Le travail d’alignement est en cours et s’appuie sur le logiciel d’alignement automatique ALINEA élaboré par Olivier Kraif (Université Grenoble 3) et le logiciel LogiTerm Pro.

à Journées d’étude

La fin du projet a été marquée par l’organisation de journées d’étude orientée vers la mise en valeur du travail de collecte et d’exploitation du corpus multilingue, et l’apport des corpus multilingues à la réflexion sur une thématique en particulier, en lien avec l’Opération « Etudes des sentiments et points de vue » associée à l’Axe Contrastivité inter-langues.

22 mai 2015 : Journées d’étude Traces de subjectivité et Corpus multilingues, FoReLL Université de Poitiers et FRED Université de Limoges. Organisateurs : R. Nita (Poitiers) et R. Marti-Solano (Limoges). Financement : PRES Limousin-Poitou-Charentes, laboratoires FoReLL et FRED. – Communications de 4 EC et 2 doctorantes de FoReLL-A, 5 EC d’autres universités françaises, 3 EC d’universités étrangères (Belgique, République Tchèque, Slovaquie).

La description du Corpus GRAFE est disponible sur ce site.

Recherche

Menu principal

Haut de page