Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 Terminographie
Derniers commentaires
Archives
22 septembre 2013

Les Voisins De Wikipédia

 Les Voisins De Wikipédia est une base lexicale distributionnelle du français construite entièrement automatiquement, à partir d'un corpus comprenant l'ensemble des articles de l'encyclopédie française Wikipédia en juin 2008.

Le corpus texte a été étiqueté au niveau morphosyntaxique par Treetagger, de l'Université de Stuttgart. L'extraction des contextes syntaxiques a été réalisée par la chaîne d'analyse syntaxique Syntex, développée par Didier Bourigault dans le cadre d'une collaboration entre le laboratoire CLLE-ERSS et la société Synomia. L'analyse distributionnelle a été réalisée par l'outil Upery développé à CLLE-ERSS par Didier Bourigault. La constitution du corpus et l'application de Syntex et Upery à ce corpus ont été réalisées par Franck Sajous.

http://redac.univ-tlse2.fr/applications/vdw.html

Publicité
Commentaires
mli07 Terminographie
  • Terminographie. Recensement et étude des termes appartenant aux nomenclatures scientifiques et techniques d'une langue. Terminotique. Terminologie informatisée. Dictionnairique. Discipline traitant de la conception des dictionnaires
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité