Apprentissage et données textuelles


Patrick Gallinari, Hugo Zaragoza, Massih-Reza Amini
Laboratoire d'Informatique Paris 6
case 169
4, place de Jussieu
75252 Paris cedex 05


Le déploiement du web incite actuellement plusieurs communautés de l'informatique à travailler sur l'accès à l'information et en particulier à l'information textuelle. La communauté apprentissage s'intéresse depuis quelques années à l'analyse de l'information textuelle en vue d'automatiser les traitements pour une gamme de tâches allant de la recherche à l'extraction de l'information. Nous présentons dans ce texte d'une part les travaux réalisés en recherche et extraction d'information pour introduire de l'apprentissage dans les chaînes de traitement et d'autre part des apports récents de l'apprentissage au domaine du texte.