Fabien Reinle
Comment manipuler simplement le contenu d'un fichier WordML ?
Manipulations autour du format WordML
Par Fabien Reinle publié le 14/05/2008 à 23:55
 
Je vous propose dans cette partie de lire le contenu du fichier qui a été créée précédemment et d'afficher sur la console le texte ainsi que le style utilisé.
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/read.png
 
Il faut avant tout récupérer le contenu de la partie principale du fichier (word/document.xml) sous forme textuelle.
 
/content/35e43e13-225f-4111-8b10-91b579dc1744/content_xml.png
 
Le SDK OpenXML nous permet de réaliser cette opération très simplement. Nous ouvrons le package (le fichier *.docx) et récupérons le Stream sous-jacent.

//  Ouverture du fichier 'sample.docx'

using (WordprocessingDocument package = WordprocessingDocument.Open(fileName, false))

{

    //  Partie principale du document (word/document.xml)

    MainDocumentPart mainPart = package.MainDocumentPart;

 

    //  Flux associé à la partie principale du document

    using (Stream stream = mainPart.GetStream())

    {

        using (StreamReader reader = new StreamReader(stream))

        {

            string innerXml = reader.ReadToEnd();

        }

    }

}

Une fois que l'on à récupéré le contenu de la partie principale sous forme textuelle, nous pouvons récupérer le modèle objet du document.Le code généré par l'outil propose 3 méthodes pour instancier le modèle:
  • LoadFromBinary
  • LoadFromFile
  • LoadFromString
Nous utiliserons pour cela la méthode suivante:

wml2 inner = wml2.LoadFromString(innerXml);

La première étape consiste à accéder au corps du document (élément body):

//  Lecture de l'élément racine du document: 'document'

CT_Document ct_document = inner.document.First;

 

//  Lecture du corps du document: 'body'

CT_Body ct_body = ct_document.body.First;

A partir du corps, on peut accéder à tous les élements définis dans la spécification du format WordML (paragraph, run, text, ...)

//  Lecture des paragraphes

foreach (CT_P ct_paragraph in ct_body.p)

{

    //  Affichage du texte de chaque paragraphe

    StringBuilder sb = new StringBuilder();

 

    //  Lecture des run

    foreach (CT_R ct_run in ct_paragraph.r2)

    {

        //  Lecture des text

        foreach (CT_Text ct_text in ct_run.t)

            sb.Append(ct_text.Value);

    }

 

    Console.WriteLine("Text: " + sb.ToString());

}

 Commentaire - Comment manipuler simplement le contenu d'un fichier WordML ? 

 Dernières Publications      

Utilisation de jQuery avec ASP.NET MVC
  Développer une IHM à page unique avec ASP.NET MVC et jQuery
par Nicolas Moyère posté le 30/06/2008 à 10:28, lu 824 fois, #0
Tags: ASP.NET MVC, Ajax
Windows Media Center et WCF : développez votre maison intelligente
  Le développement d'applications pour Windows Media Center est facilité avec l'arrivée du SDK 5.3. Même si l'on sent un modèle objet bien lourd derrière, il devient plus facile d'exposer les fonctionnalités de WMC sous la forme de services WCF.
par Frédéric Colin posté le 23/06/2008 à 08:04, lu 891 fois, #0
Notions avancées avec Biztalk Server 2006 R2
  Utilisation des notions d'interchange, corrélation et convoi avec BizTalk Server 2006 R2
par Kader Yildirim posté le 09/06/2008 à 08:04, lu 705 fois, #0
Lucene Persistence Engine pour Evaluant Universal Storage Services
  Suite à l'article de Laurent Kempé, voici un moteur de stockage pour EUSS permettant l'indexation d'entités métier avec Lucene.
par Nicolas Penin posté le 01/06/2008 à 23:38, lu 1091 fois, #1
Tags: C#, Linq
XMLA Trivia : Découverte du XMLA
  Le XMLA (XML for Analysis) est un langage normalisé par plusieurs éditeurs BI pour simplifier l'accès aux données aux cubes et aux métadonnées des bases multidimensionnelles.
par Renaud Harduin posté le 25/05/2008 à 11:57, lu 1008 fois, #1
Exploiter les données CSV via Linq en toute simplicité
  A partir du requêteur dynamique fourni en exemple avec Visual Studio 2008, nous allons essayer de remplir les propriétés d'un ensemble d'objets à partir des données d'un fichier CSV. Nous enrichirons aussi le parseur de nos propres fonctions.
par Frédéric Mélantois posté le 17/05/2008 à 11:41, lu 2787 fois, #0
Comment manipuler simplement le contenu d'un fichier WordML ?
  Manipulations autour du format WordML
par Fabien Reinle posté le 14/05/2008 à 23:55, lu 1406 fois, #0
Polymorphisme et contrats de données WCF
  WCF aborde les types polymorphes du point de vue de la sérialisation. En effet, la connaissance du type réel potentiel est rendue nécessaire dès la description du contrat de données. Une fois n'est pas coutume, j'ai réalisé l'exemple en VB.NET.
par Frédéric Colin posté le 14/05/2008 à 08:40, lu 2931 fois, #2

 Dernières Actualités      

Reprise du projet Reflector par RedGate
  La nouvelle était connue depuis quelques jours par les développeurs de plugins, mais c’est désormais officiel : Lutz Roeder, le responsable de Reflector confie à la société RedGate le futur du projet....
Microsoft publie Visual Studio 2008 Service Pack 1
  Il est recommandé d’utiliser l’outil Visual Studio 2008 Service Pack preparation Tool avant de faire l’installation du Service Pack si vous avez installé des versions béta sur votre machine. Une fois que...
Tags: Framework .NET, Visual Studio 2008
Evaluant dévoile ses sources
  L'ensemble des projets R&D réalisés par les consultants de la SSII Evaluant sont en cours de publication sur CodePlex . L'objectif est de les centraliser et surtout d'augmenter leur visibilité. L'avantage...
Le Silverlight Tour en français!
  Le Silverlight Tour passe maintenant dans les pays francophones! En effet RunAtServer Consulting est partenaire du Silverlight Tour pour la gestion de cette formation Silverlight en français à commencer...
Microsoft publie ASP.NET AJAX 4.0 CodePlex Preview 1
  Cette pré-version contient les améliorations suivantes: Client-side template rendering Declarative instantiation of behaviors and controls DataView control Markup extensions Bindings Vous pouvez en lire...
Tags: Ajax
Deep Earth – Une belle utilisation de Virtual Earth et de Silverlight Deep Zoom
  Ce projet très intéressant est disponible sur Codeplex et vous pouvez voir une démo sur la page suivante . Bien entendu comme touts les projets sur Codeplex vous avez accès aux sources....
Tags: Silverlight