LAY Marie-Hélène

NOM, Prénom : LAY, Marie-Hélène
Section CNU (Qualification(s)) :  7°
Équipe : A
Axes et/ou opérations :  « Corpus ; des unités aux discours »
Coordonnées : marie-helene.lay@univ-poitiers.fr

 

SUJETS DE RECHERCHE

  • Humanités numériques, Linguistique sur corpus, Annotation manuelle, Lexicographie computationnelle.
  • Représentation de la variation en diachronie, diatopie, synchronie.
  • Etudes monographiques sur corpus : lexicologie, étude des prépositions, construction des discours.

 

LABORATOIRES ET PROJETS DE RECHERCHE

Laboratoires

  • Depuis 2014       Responsable de l’équipe A du FoReLL : “Corpus : des unités aux discours”.
  • Depuis 1998       Membre du laboratoire FoReLL (EA 3816) – Formes et Représentations Linguistiques et Littéraires.
  • 2007-2009           Membre du laboratoire ICAR3, UMR5191, dans le cadre d’une délégation CNRS.
  • 1992-1998           Membre du TheDeL – Théorie et Description en Linguistique (Paris V).
  • 2007-2010           Membre de l’ANR Textométrie et du groupe de réflexion CoLiGram, ENS-LSH.
  • 2003-2006           Membre du groupe de travail LexiquePourLeTal ; Proposition de norme des lexiques pour le traitement automatique du langage.

Projets de recherche

  • Depuis 2016       « Europakrise, Sprache und Regionalität. Das parlanjhe de Vendàie ». Université de Würzburg, porteur Julien Bobineau.
  • 2016-2017           ARC Poitiers-Tours. L’axe « Tours-Poitiers à l’aube des temps modernes : la variation Français / Langues Régionales ». Porteur MH Lay.
  • Depuis 2015       ANR RESTAURE. RESsources informatisées et Traitement AUtomatique pour les langues Regionales. Contribution aux activités d’étiquetage sur les Langues Régionales (logiciel NaviLog), co-organisation de rencontres scientifiques.
  • Depuis 2014       ANR-DFG PRESTO. Contribution à l’élaboration du modèle d’étiquetage morpho-syntaxique en diachronie. Ateliers AnaLog. Le projet PRESTO (L’évolution du système PREpositionnel du français. Approches STatistique et textOmétrique) a pour but l’étude diachronique de l’emploi, des valeurs sémantiques et discursives des prépositions françaises à, en, par, contre, dès, devant, entre, pour, sans, sur, sous, vers, dans, de l’ancienne langue.  http://icar.univ-lyon2.fr/pages/equipe33-projets.htm
  • Depuis 2014       CLGS (Computational Literary Genre Stylistics), sur l’évolution des états de langue dans le théâtre classique en langues romanes. Université de Würzburg, porteur Christof Schoech.
  • Depuis 2013       ACI internationale « Les sentiments à travers les corpus d’apprenants » (http://ll.univ-poitiers.fr/didalang-fles/projets-de-recherche/). Université de Chypre, Université de Varsovie – Pologne, Université de Thessaloniki – Grèce, Université d’Istanbul – Turquie. Coordination : F. Valetopoulos.
  • 2009                      AAP Poitiers Tours. « « Traitement linguistique des textes de la Renaissance, en français et langues régionales » (TLITER) ». Porteur MH Lay.
  • 2007-2010           Projet ANR TXM. Délégation CNRS (2007). Contribution : participation à l’élaboration et la conceptualisation des fonctionnalités textométriques ; spécification et développement d’AnaLog. http://textometrie.ens-lyon.fr/
  • 2007-2010           Projet TELPOS :Textes électroniques poitevin-saintongeais, base de données de l’écrit poitevin-saintongeais du XVIe siècle à nos jours. Projet porté par le laboratoire FoReLL, la MSHS de Poitiers et la région Poitou-Charentes.
  • 2004-2006           Projet SuiteMT. Logiciel de gestion de base de données lexicales. Porteur : Tagmatica. Projet soutenu par le MENESR ; http://www.technolangue.net/
  • Depuis 2000.      Projet Bibliothèques Virtuelles Humanistes, porté par Marie-Luce Demonet, Centre d’Étude sur la Renaissance, Université François Rabelais de Tours http://www.bvh.univ-tours.fr/ Contribution : développement d’outils et de ressources linguistiques.

 

RESPONSABILITÉS SCIENTIFIQUES

Bureaux de laboratoire

  • Depuis  2010                     Membre élu du conseil de laboratoire FoRell
  • Depuis  2014                     Membre du conseil de l’école doctorale CCL (Cognition, Comportement, Langage)
  • Depuis 2013       Vice-présidente de la CES 7°-11°-14-18°
  • 2015-                    Membre du CNU (liste complémentaire)
  • 2011-2015           Membre élue du CNU

 Activités  éditoriales

  • Depuis 2011 Participation à des créations/développement, comités de lecture de revues francophones dans les Balkans (Slovénie, Bosnie-Herzegovine), par exemple FiLoLog (http://flf.unibl.org/pocetna/), Linguistica (http://revije.ff.uni-lj.si/linguistica ).
  • Depuis 2004 Relecture pour des revues (Cahiers FoReLL, Volumes PUR) et actes de colloque organisés par le CerLiCO ou à Poitiers : Didactique et évaluation des compétences, journées sur l’expression des sentiments, Volume sur les relatives, etc.
  • 2001                Membre du comité de lecture de la journée A3CTE, plateforme AFIA, Grenoble.
  • Depuis 1999 Comités scientifiques et comités de lecture pour des journées d’étude et des colloques soit en linguistique (comme TALN, JADT), soit en Digital Humanities.

 Sociétés de spécialistes nationales ou internationales

  • Depuis 1998 Membre du CerLiCO, Cercle linguistique du Centre et de l’Ouest, (CerLiCO, https://cerlicoasso.wordpress.com),
  • Depuis 2016  Au titre du  Projet NaviLog. Membre du Consortium IR-Corpus CAHIER (labellisé en 2011), Corpus d’Auteurs pour les Humanités : Informatisation, Édition, Recherche. http://cahier.hypotheses.org/
  • Depuis 1989       Membre de l’ATALA (Association pour le Traitement Automatique des Langues) http://www.atala.org/ .

Organisation de manifestations scientifiques

  • Responsable de la journée d’études « Variété, variation, norme : notation et annotation de la variation et des états de langue non-standards » (Poitiers, novembre 2016).
  • Co-organisatrice du colloque : « le choix des mots » (Poitiers, novembre 2015).
  • Responsable de la journée d’études « Corpus et lexique : modélisations théoriques, formalismes de représentation, exploitations » (Poitiers, novembre 2014).
  • Responsable de la journée d’études « Éditer aujourd’hui : quel support pour quel projet ? » (Poitiers, 2010).
  • Responsable de la journée d’études « Patrimoine Écrit et Environnement Numérique », Poitiers, http://emf.fr/3668/journee-ptrimoine-ecrit-et-environnement-numerique
  • Membre du comité d’organisation des JADT 2008 (Journées Internationales d’analyse de données textuelles), Ens-Lyon, http://jadt2008.ens-lyon.fr/
  • Responsable de la journée d’études « Plongée au cœur des textes (ADT) », Poitiers.
  • Co-organisatrice de Cift’04 (Conférence Internationale en Fouille de Textes) https://listes.adbs.fr/sympa/arc/adbs-info/2003-12/msg00012.html
  • Responsable de la journée d’études « Le Dictionnaire électronique comme fait de société », MSHS de Poitiers.
  • Membre du comité d’organisation de CIFT’02 conférence internationale sur la fouille de textes (Conférence Fédérative sur le Document), Hamamet.
  • Responsable de la journée d’étude « Lire Nolke », avec la participation de Henning Nolke, (Paris V).

 

PRINCIPALES PUBLICATIONS

Livres

  • Linguistique de/sur corpus et Humanités Numériques, HDR soutenue à Poitiers le 24 Novembre.
  • Une lecture du phénomène de la composition lexicale : description des structures et comportements des composés commençant par une préposition. Prix de Thèse de linguistique générale, Paris V.

Édition et coordination de volumes collectifs

Chapitres de livre

  • Avec F. Valetopoulos, « Exprimer ses émotions à l’oral : étude d’un corpus d’apprenants» in Krystyna Wroblewska-Pawlak, Jolanta Sujecka-Zajac & Elzbieta Pachocinska (dir.). Regards sur l’oral et l’écrit. Varsovie : Presses Universitaires de Varsovie. 218-223.
  • Avec J-L Duchet, « Dictionnaires et contextualisation pour la traduction juridique (français-anglais-espagnol) », in P. Ligas et P.  Frassi (dir.), Lexiques. Identités. Cultures, QuiEdit, Vérone.
  • « AnaLog, un outil pour la comparaison et l’étude de corpus annotés », in Le langage et ses niveaux d’analyse, PUR.
  • Document d’entreprise : « Qualidoc, outil d’aide à la rédaction de devis d’intervention sur œuvre d’art », in Traitements et pratiques documentaires : vers un changement de paradigme ?, Sous la direction d’Evelyne Broudoux et Ghislaine Chartron, Collection « Sciences et techniques de l’information », 456 p., ISBN 978-2-84365-116, p. 241-263. http://www.adbs.fr/traitements-et-pratiques-documentaires-vers-un-changement-de-paradigme–54378.htm

Articles

  • avec S. Diwersy, A. Falaise, G. Souvay. « Ressources et méthodes pour l’analyse diachronique », Langages,
  • « L’utilisation des corpus pour observer le figement : de quelques syntagmes en en. ». in Scolia n° 29, La préposition en. 59-78.
  • avec J.C Dourdet. « Création de ressources lexicales pour une langue d’oïl : le parlanjhe », Actes en ligne de TaLaRe, (Caen, 22 juin 2015), http://www.atala.org/taln_archives/ateliers/2015/TALaRE/talare-2015-long-001.pdf
  • « Traitements pour l’analyse du français préclassique », Actes de TALN 2015, Caen, avec S. Diwersy et A. Falaise
  • « En matière de et consorts : pertinence du discours et crédibilité du locuteur » , Actes dela JE Une grammaire sous influence de l’oral ?, Poitiers, 10 avril. http://www.lll.cnrs.fr/une-grammaire-sous-influence-de-l-oral
  • avec S. Diwersy. « Elaboration assistée de modèles d’annotation pour le français (pré)classique : protocole et interface numérique », Actes de la Frankoromanistentagung Interfaces Numériques. Université de Wuerzburg.
  • « VariaLog: how to locate words in Early Modern Stages of French and English », Oxford, publié sur le site EEBO-TCP. http://www.bodleian.ox.ac.uk/eebotcp/conferences/eebotcp2012/abstracts/
  • avec C. Pagani,« Terminologie et représentations linguistiques. Les formes en -rais dans les Épîtres de Cicéron traduites par Dolet », Actes du Colloque du Cerlico 2012.
  • avec J-L. Duchet. “Corpus Linguistics and Cultural Aspects as perceived through aligned bilingual corpora of legal texts”, LLCS, Military Technical Academy Publishing House Bucharest, Romania, p. 79-93.
  • « VariaLog: How to locate words in a French Renaissance Virtual Library », IC-ININFO, Kos, PeterLang.
  • avec T. Vincent, F. Chabaud, R. Bouet, J-L. Roelandt. « Méthode d’étude des représentations sociales en santé mentale », 10e conférence internationale sur les représentations sociales, Tunis.
  • « Fonctionnalités textométriques : proposition de typologie selon un point de vue utilisateur », in JADT 2010, Roma, 12 p., Bénédicte Pincemin Serge Heiden Marie-Hélène Lay, Jean-Marc Leblanc, Jean-Marie Viprey http://www.cavi.univ-paris3.fr/lexicometrica/jadt/jadt2010/allegati/JADT-2010-0341-0354023-Pincemin.pdf
  • « Pour une exploration humaniste des textes : AnaLog », in JADT 2010, Roma. http://lexicometrica.univ-paris3.fr/jadt/jadt2010/allegati/JADT-2010-1045-1056106-Lay.pdf
  • « Écrire en entreprise : une double expertise pour un outil d’aide à la rédaction », in Actes de « de la France au Québec – L’Écriture dans tous ses états », Poitiers.
  • “Some elements of reflection about sustainability and shareability of the Humanist Virtual Library (Bibliothèques Virtuelles Humanistes, BVH): a synthesis and experiment feed-back”, Atelier “Sustainability of Language Resources and Tools for Natural Language Processing”, LREC Conference, Marrakech, publiées dans les Proceedings, http://www.lrec-conf.org/proceedings/lrec2008
  • avec M-L. Demonet. “Digitizing European Renaissance prints: A 3-year experiment on image-and-text retrieval”, Conférence de Kolkata (Calcutta), International Workshop on Digital Preservation of Heritage (IWDPH07), Indian Statistical Institute, Singapour, World Scientific.
  • “Automation tools for digitized Renaissance documents”, in Actes du colloquium “What to Do With a Million Books”, 5th and 6th November 2006, University of Chicago.
  • « Outils d’analyse automatique et catégorisation des unités », in Actes de CerliCo 2002.
  • « Application d’un outil statistique à la classification d’unités lexicales », in Proceedings of the 34th Colloquium of Linguistics, Peter Lang, Karlsruhe, 10 p.
  • « Représentation documentaire et construction de la connaissance », Le Médiéviste et l’Ordinateur, n° 41, IRHT, 16 p.
  • « De l’accès à l’information à sa représentation : l’analyse de données textuelles », Réseaux humains réseaux technologiques, n° 3, Poitiers, MSHS, p. 32-41.
  • « Après la numérisation de textes préclassiques : naissance d’Humanistica », Actes de CIDE 2000, p. 327-335. Document Électronique Dynamique – Dynamic Electronic Document, Coordinateurs : Mauro GAIO, Eric TRUPIN, ISBN 2-909285-15-4.
  • « Adaptation d’un lemmatiseur au corpus rabelaisien, naissance d’Humanistica », in Actes de JADT 2000, EPFL, avec Marie-Luce Demonet p. 267-278.
  • « L’exploration informatisée du corpus rabelaisien : Humanistica », Rabelais 2000, Cerisy-la-Salle,.
  • « Fonctionnement des locutions adverbiales : complexité interne et externe », Cahiers FoReLL, Poitiers, MSHS, p. 52-64.
  • avec ML. Demonet. « Du papier au texte électronique et inversement : dernières évolutions du corpus rabelaisien », Foire des études françaises : Les études françaises valorisées par les nouvelles technologies d’information et de communication ; Toronto, publié sur http://www.etudes-francaises.net
  • « Informatisation et lemmatisation du corpus rabelaisien », Le Médiéviste et l’ordinateur, n° 38, IRHT, p. 18-23.
  • « Calcul d’index, calculs de cartes : représentation d’un fonds documentaire », Représentation[s], Poitiers, MSHS, p. 37-48.
  • « Homogénéïsation et traitement de données multi-sources : application sur des abstracts d’articles scientifiques », Actes de la 5e journée de L’Ile Rousse. Société Française de Bibliométrie Appliquée, p. 62-77.
  • « Sur la piste des mots composés », Actes de la 1re journée de l’École doctorale de Paris V, L’Harmattan, p. 11-22
  • « Des unités lexicales constituées de plusieurs mots graphiques. Une méthode de classification des unités selon leurs propriétés », Actes du XXIe colloque de linguistique fonctionnelle, Iasi, Roumanie, p. 99-103.
  • “A Generic Model for Reusable Lexicons: The Genelex Project”, Literary & Linguistic Computing, Vol. 9-1, Oxford University Press.

Communications / Conférences (depuis 2015)

  • 2016      « NaviLog : annotation manuelle et heuristique de la valorisation des corpus », AG du consortium CAHIER, Paris, 24 Novembre 2016.
  • 2016      « Quelle place pour l’annotation manuelle en SHS », Colloque «Données, métadonnées des corpus et catalogage des objets en sciences humaines et sociales », MSHS de Poitiers, 6-7 juin 2016.
  • 2016      Digitalität und diversität –die Geisteswissenschaften im Jahr 2026. Intervention invitée à la table ronde : https://www.wissenschaftsjahr-zukunftsstadt.de/veranstaltungen/detail/digitalitaet_und_diversitaet_die_geisteswissenschaften_im_jahr_2026.html , Université de Mainz, 29 janvier 2016.
  • « Using AnaLog to build or improve lexical resources based on corpus attestation during a semi-manual annotation process », SLI, Malte, 24-26 septembre 2015.
  • « Création de ressources linguistiques pour le Poitevin-Saintongeais. ». Journées Internationales de Linguistique de Corpus, Orléans, 2-4 septembre 2015.
  • « NaviLog : pré-annotation de langues Régionales en vue de l’apprentissage », atelier ANR RESTAURE, Toulouse, 25-27 août 2015.
  • « En fonction de, en matière de, en terme(s) de : quelques outils du mieux dire », Approximation, modulation, ajustement, 29° colloque du CerLiCO, Rennes, 11-12 juin 2015, http://cerlico.asso.univ-poitiers.fr/IMG/pdf/programmecerlico2015.pdf
  • Présentation de NaviLog au salon INNOVATIVES SHS 2015, CNRS, « NaviLog, un logiciel au service des humanités digitales ». http://innovatives.cnrs.fr/innovatives-shs-2015/exposition/territoire  , Paris, 16 & 17 juin 2015.
  • L’incrémentation de ressources lexicales à l’aide d’AnaLog, Colloque Presto, Université de Cologne, 11-13 février 2015.

Travaux de vulgarisation

 

AUTRES PRODUCTIONS

Corpus

  • Depuis 2000       Annotation morpho-syntaxique de textes de la renaissance (BVH Tours) : Rabelais (Pantagruel 1532 et 1542) ; Ronsard (Discours sur les miseres de ce temps) ; Marguerite de Navarre, Montaigne, (Essays) en cours.

Ressources dictionnairiques

  • Depuis 2000       Bases lexicales de textes du 16e siècle, dictionnaire des flexions du 16e, typologie des grandes évolutions grapho-phonématiques du français du 16e, dictionnaire de dérivation du français contemporain

Outils

  • Depuis 2007       NaviLog est un logiciel « léger » permettant d’outiller l’annotation manuelle, reposant sur l’intégration de AnaLog, outil d’annotation à partir d’un outil de concordances CQP  et  de VariaLog [financement Google Award],  brique logicielle permettant de traiter la variation graphique. Réalisé en Java, disponible pour Mac, PC et Unix,  fonctionne sur les langues écrites en caractères latins, permet de choisir et/ou de construire  jeux d’étiquettes et ressources dictionnairiques. Cet outil est le  fruit d’une collaboration entre FoReLL, le centre d’études sur la renaissance (UMR 7323, Tours) [financement CESR + ARC Tours-Poitiers] et le laboratoire ICAR (UMR 5191 ENS-Lyon).
  • 2006-2009           Qualidoc : outil d’aide à la rédaction de devis d’intervention sur œuvre d’art, logiciel d’aide à la rédaction de documents pour les artisans d’art.
  • 1999-2001           Humanistica,  Adaptation d’un tagger tri-classe à la gestion de l’hétérographie en français pré-classique.

Distinctions

Recherche

Menu principal

Haut de page