Corpus écrits (unilingues ou multilingues)

Corpus PLECI (Poitiers-Louvain Échange de Corpus Informatisé)

Responsable: Raluca NITA
Le Corpus PLECI est un corpus bilingue, écrit compilé entre 1999 et 2007 conjointement par l’équipe A (axe contrastivité) du laboratoire FoReLL et le CECL (Centre for English Corpus Linguistics) de l’Université Catholique de Louvain, Belgique, sous la responsabilité d’Hélène Chuquet (Poitiers) et de Sylviane Granger (Louvain).

document17|right

Type de corpus

Corpus écrit ; parallèle et comparable (originaux et textes traduits dans chaque langue) ; textes journalistiques et littéraires
Langues concernées.
français – anglais – allemand

Taille

Corpus français <> anglais : total d’environ 1,3 millions de mots (correspondant au comptage des textes originaux, auxquels s’ajoute l’équivalent en textes traduits)
Presse français > anglais : 360 000 mots
Presse anglais > français : 300 000 mots
Romans français > anglais : 350 000 mots
Romans anglais > français : 300 000 mots
Presse, corpus aligné français-anglais-allemand : 135 000 mots
Originaux français : 87000
Originaux anglais : 48000

Provenance des données

Presse : principalement Le Monde Diplomatique (originaux français et anglais) ; Le Monde (traduction dans le Guardian Weekly) ; The Economist (traduction dans le Courrier International ; et articles de sources diverses, originaux en français ou en anglais, avec traduction.
Romans du XXe siècle : originaux anglais pour la plupart britanniques, quelques-uns d’origine irlandaise ou américaine ; le corpus d’originaux français comprend également trois romans de Jules Verne.

Format : .doc et .txt

Alignement

Corpus aligné manuellement, à la phrase ou au paragraphe, selon l’origine des fichiers

Exploitation (logiciels)

Exploitable avec les concordanciers multilingues ParaConc et MultiConcord

Lien : Une partie du corpus (presse, environ 400 000 mots, et romans de Jules Verne) est accessible en ligne : http://cabal.rezo.net/

Contact :
Raluca Nita – raluca.nita@univ-poitiers.fr
Hélène Chuquet – helene.chuquet@univ-poitiers.fr

Corpus d’apprenants Chy-FLE et Poitiers-FLE

Corpus d’apprenants écrit (en cours) : Le corpus contient deux sous-corpus : Chy–FLE, réalisé en collaboration avec Efi Lamprou, Professeure assistante, Université de Chypre, et Poitiers-FLE, en collaboration avec le Centre FLE de l’Université de Poitiers.

Caractéristiques: Chy-FLE
Pays d’origine: Chypre
Token: 130.000
Niveau de compétence: intermédiaire
Âge: Entre 18 et 22 ans
L1: Grec standard et grec chypriote
L2: Anglais
Niveau d’études: Universitaire
Type de production écrite: Argumentatif
Durée: Limitée
Utilisation d’outils de référence: Non
Objectifs: Évaluation

Caractéristiques: Poitiers-FLE
Pays d’origine: Divers
Token: 60.000
Niveau de compétence: Intermédiaire
Âge: Entre 18 et 25 ans
L1: Diverses
L2: Anglais
Niveau d’études: Universitaire
Type de production écrite: Argumentatif et descriptif
Durée: Limitée
Utilisation d’outils de référence: Non
Objectifs: Évaluation

Contact : Freiderikos Valetopoulos, fvaletop@univ-poitiers.fr

Recherche

Menu principal

Haut de page