Corpus PLECI (Poitiers-Louvain Échange de Corpus Informatisé)

Présentation :

Le Corpus PLECI est un corpus bilingue (et partiellement trilingue), écrit compilé entre 1999 et 2007 conjointement par l’équipe A (axe contrastivité) du laboratoire FoReLL et le CECL (Centre for English Corpus Linguistics) de l’Université Catholique de Louvain, Belgique, sous la responsabilité d’Hélène Chuquet (Poitiers) et de Sylviane Granger (Louvain).

Le corpus PLECI comprend un volet journalistique et un volet littéraire.

Type de corpus

Corpus écrit bidirectionnel – parallèle et comparable (originaux et textes traduits dans chaque langue) ; textes journalistiques et littéraires

Langues concernées :

français – anglais(et quelques textes en allemand)

Taille :

Corpus français <> anglais : total d’environ 1,3 millions de mots (correspondant au comptage des textes originaux, auxquels s’ajoute l’équivalent en textes traduits)

Presse français > anglais : 360 000 mots

Presse anglais > français : 300 000 mots

Romans français > anglais : 350 000 mots

Romans anglais > français : 300 000 mots

Presse, corpus aligné français-anglais-allemand : 135 000 mots

Originaux français : 87000

Originaux anglais : 48000

Provenance des données:

Données littéraires : Romans du XXe siècle. Les originaux anglais sont pour la plupart britanniques, quelques-uns d’origine irlandaise ou américaine ; le corpus d’originaux français comprend également trois romans de Jules Verne.

Données journalistiques : Le Monde Diplomatique (originaux français et anglais) ; Le Monde (traductions dans le Guardian Weekly) ; The Economist (traductions dans le Courrier International) ; et articles de sources diverses, originaux en français ou en anglais, avec traduction.

Format : .doc et .txt

Alignement : Corpus aligné manuellement, à la phrase ou au paragraphe, selon l’origine des fichiers

Logiciels d’exploitation : Exploitable avec les concordanciers multilingues ParaConc et MultiConcord

Utilisation : Le Corpus PLECI est accessible à l’ensemble des membres du laboratoire et fait l’objet d’exploitation en linguistique contrastive par les chercheurs du Laboratoire FoReLL et du CECL dans des approches énonciative, syntaxique, lexicologique, phraséologique sur des thématiques diverses (traductions des adjectifs en X + V –ing, pratiques discursives et verbes introducteurs en anglais et en français, aller vs be going to, expression de l’espoir et du souhait en français et en anglais, traductions de on, expression de la cause, relation inter-propositionnelles, etc.). Les articles issus de ces travaux ont été publiés dans différents revues/ collections, comme par exemple : le volume de « Rivages Linguistique » sur Causalité, contrastivité, corpus (Paillard & Chuquet, dir., 2006) ; la revue Palimpsestes (n° 14-2002, n° 19-2007), la Revue Française de Linguistique Appliquée (vol. XIV-1, juin 2009), la revue Languages in Contrast chez John Benjamins (Vol. 6.1, 2006, Vol. 9.2,2009).

Deux thèses soutenues en 2006 au laboratoire FoReLL en linguistique contrastive sont basées sur l’exploitation de ce corpus.

Thèses soutenues en lien avec le corpus: Deux thèses soutenues en 2006 au laboratoire FoReLL en linguistique contrastive sont basées sur l’exploitation de ce corpus.

Laure Lansari, Les périphrases « aller » + inf. et « be going to » en français et en anglais contemporains, sous la direction d’Hélène Chuquet, Université de Poitiers, Décembre 2006.

Raluca Nita, Discours rapporté, repérages et organisation textuelle : étude contrastive anglais-français-roumain, sous la direction d’Hélène Chuquet, Université de Poitiers, Décembre 2006.

Communications :

Le corpus a également fait l’objet de présentations concernant la méthodologie de constitution et d’exploitation :

Chuquet, H. et F. Zumstein, 2009, « Explorer la presse dans deux langues… ou plus. Présentation du corpus PLECI », Communication Colloque International du CeRLiCo.

Chuquet, H. et J.-L. Duchet, 2010, « Corpus plurilingues : leur constitution et leur utilisation en linguistique contrastive et traductologie », Communication, Campus d’été Métiers des langues et traduction, Université de Poitiers.

Le Corpus sert également de support aux étudiants du Master Linguistique dans les recherches liées au travail des séminaires « Analyse sur Corpus » et « Linguistique contrastive » ainsi qu’à l’élaboration de leur TER.

Lien : Une partie du corpus (presse, environ 400 000 mots, et romans de Jules Verne) est accessible en ligne : http://cabal.rezo.net/

Contact :

Raluca Nita – raluca.nita@univ-poitiers.fr, Hélène Chuquet – helene.chuquet@univ-poitiers.fr

Recherche

Menu principal

Haut de page