Audrey Laroche

Learn More
Context-based projection methods for identifying the translation of terms in comparable corpora has attracted a lot of attention in the community, e.g. Surprisingly, none of those works have systematically investigated the impact of the many parameters controlling their approach. The present study aims at doing just this. As a test-case, we address the task(More)
L'extraction terminologique automatique contrastive (ETAC), où les candidats termes sont repérés au moyen de la comparaison de leurs fréquences dans des corpus techniques et non techniques, est influencée par plu-sieurs paramètres. L'un des plus importants est la taille du corpus non technique, car ce dernier demeure le même d'une extraction à l'autre. À(More)
RÉSUMÉ L'approche standard d'identification d'équivalents terminologiques à partir de corpus comparables repose sur la comparaison de mots contextuels en langues source et cible et sur l'utilisation d'un lexique bilingue. Nous analysons manuellement, selon des critères linguistiques (parties du discours, spécificité et relations sémantiques), les propriétés(More)
Dans une tâche consistant à trouver l'auteur (parmi 53) de chacun de 114 textes, nous analysons la performance de modèles de langue et de modèles stylométriques sous les angles du rappel et du nombre de paramètres. Le modèle de mots bigramme à lissage de Kneser-Ney modifié interpolé est le plus performant (75 % de bonnes réponses au premier rang). Parmi les(More)
  • 1