Ceci est l'ensemble des exercices effectués pour le cours « Documenst Structurés » de Master 1 Traitement Automatique des Langues.
Dans le cadre de ce cours, on avait divers exercices (dont 4 étaient obligatoires) à faire et mettre sur ce site les fichiers au format XML, accompagnés des feuilles de styles XSLT.
Le site montre donc ce qu’on a étudié durant le semestre, chaque exercice effectué ayant sa propre page avec les résultats (en formats XML
, DTD
ou XSLT
).
Les exercices à faire obligatoirement étaient les suivants :
- Exercice 3 : TEI
- Exercice 5 : DUCHN
- Exercice 14.1 : Extraction dans les Fils RSS du Monde à partir de la sortie TreeTagger
- Exercice 14.2 : Extraction dans les Fils RSS du Monde à partir de la sortie UDPipe
- Exercice 15 : Patrons morpho-syntaxiques et relations de dépendance sur la base de Trameur From Rhapsodie
Plusieurs outils ont été utilisés pour effectuer le devoir. Globalement, l'éditeur de texte Sublime Text a servi pour rédiger les documents manuellement ou pour avoir l'aperçu rapide des fichiers de travail volumineux. Un autre outil principal, c'est Oxygen XML Editor dont la version d'usage académique nous a été fourni. C'est un très bon outil pour la vérification/validation des documents, pour la construction XPath et XQuery et les autres tâches liées au format XML. Enfin, on a bien utilisé l'outil Base X, léger et performant, pour rédiger nos requêtes XQuery. Tous les outils sont accessibles pour le système MacOS.