Fabien Reinle
Comment manipuler simplement le contenu d'un fichier WordML ?
Manipulations autour du format WordML
Par Fabien Reinle publié le 14/05/2008 à 23:55, lu 2466 fois, 6 pages
 2 | Génération du modèle objet
Même si l'objet de cet article n'est pas la description du format OpenXML, un bref rappel s'impose.
Un document OpenXML est en fait une archive (un package) contenant plusieurs fichiers (des parts) (voir Structure d'un document OpenXML)

Pour être valide, un document doit contenir au moins les parties suivantes:
  • word/document.xml: la partie principale du fichier (le contenu)
  • _rels/.rels.xml: le fichier de relations principal
  • [Content_Types].xml: les types de fichiers contenu dans le package
Nous ne nous intéresserons dans cet article qu'à la partie principale du document.
Microsoft fournit les spécifications du format WordML sous forme de schémas XML (Spécifications OpenXML)
Il existe 2 manières de générer le code à partir des schémas:
  • Ecrire le code à la main
  • Utiliser un outil comme Altova XML Spy (version démo)
Nous allons bien sûr utiliser la deuxième méthode, bien plus rapide et efficace que la première!

Etape 1: Décompresser l'archive contenant les schémas OpenXML

Etape 2: Ouvrir Altova XmlSpy et ouvrir le fichier wml.xsd contenu dans le dossier qui vient d'être décompressé
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/openwml.png
 
Etape 3: Allez sur DTD/Schema -> Generate Program Code
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/generatecode.png
 
Etape 4: Configuration de la génération
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/config1.png
 
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/config2.png
 
Etape 5: Génération du code

Une fois l'opération terminée, 4 projets sont générés:
  • Altova
  • AltovaXml
  • wml
  • wmlTest
wml est le projet principal. C'est lui qui contient l'ensemble du modèle de WordML.
Altova et AltovaXml sont des projets contenant les types standards.
wmlTest est un projet d'exemple fournit par XmlSpy. Nous ne nous en servirons pas dans cet article.
L'ensemble des classes correspondant à la spécification de WordML est généré dans le projet wml. Le diagramme ci-dessous présente quelques classes, dont celles qui seront utilisées dans cet article:
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/class_diagram.png
 
Description des classes:
  • wml2: le modèle de la partie principale
  • CT_Document: le modèle de l'élément document (un seul par partie principale)
  • CT_Body: le modèle du corps (un seul par document). Body contient une liste d'éléments paragraph.
  • CT_P: le modèle de l'élément paragraph. Paragraph contient une liste d'éléments run.
  • CT_R: le modèle de l'élément run. Run contient une liste d'éléments text.
  • CT_Text: le modèle de l'élément text
  • CT_PPr: le modèle des propriétés de l'élément paragraph
  • CT_RPr: le modèle des propriétés de l'élément run
 
» Démarrer une discussion