Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

Atteint de JavaScriptite Aiguë [Cyril Durand]

Expert ASP.net Ajax et WCF, Cyril Durand parle dans son blog de point techniques sur ASP.net, ASP.net Ajax, JavaScript, WCF et .net en général. Cyril est également consultant indépendant, n'hésitez pas à le contacter pour de l'assistance sur vos projets

Actualités

  • Blog de Cyril DURAND, passionné de JavaScript, Ajax, ASP.net et tout ce qui touche au developpement Web Client-Side.

    N'hésitez pas à me contacter pour vos projets .net : architecture, accompagnement, formation, ...

    View Cyril Durand's profile on LinkedIn
    hit counters


    Expertise Commerce server et BizTalk

DOCX2HTML : conversion d'un fichier Word 2007 en HTML

Comme vous l’a annoncé Neodante, mercredi dernier s’est déroulé un mercredi du développement sur OpenXML, j'ai eu le privilége de présenter un de mes projets : DOCX2HTML.

Ce projet est né d’une idée de Nix lorsqu’il a découvert le nouveau format de Word 2007 : un zip qui contient pleins d'infos.

Depuis toujours la publication d’article sur internet est une tâche compliqué et fastidieuse. Lorsque nous avons conçue TechnoS-SourceS : un site orienté professionnels de l’informatique où vous pouvez retrouver des articles techniques pointus écrit par tous les membres de la communauté, nous avions besoin de mettre en place un système de publication de contenu.

Jusqu'à récemment nous utilisons un système « classique » : la FreeTextBox avec une galerie d’image mais cela pose plusieurs problèmes :

  • Envoie des images une à une 
  • Rédaction dans un navigateur
    • Fenêtre de petite taille
    • Pas de sauvegarde
    • Pas « d’aperçu avant impression »
  • Pas de mis en forme commune
  • etc... (ceux qui ont déjà écrit des articles via la FTB savent de quoi je parle ;-))

OpenXML résoud ces problèmes en effet un document enregistré sous le format « Word 2007 » n’est qu’un zip qui contient le contenu et les styles dans un format XML et les images. En plus on peut enregistrer un document docx avec Word 2007 mais aussi avec Word 2003 grâce à un add-in ou encore avec OpenOffice.

Parmi les avantages de ce format on retrouve :

  • La facilité de publier un article (on envoie seulement le zip)
    • Plus besoin d'envoyer les images une à une
    • Correcteur orthographique
    • Utilisations d'un vrai éditeur de texte
  • Une mis-en-forme commune : Le format OpenXML sépare le contenu de la présentation, il nous suffit alors de conserver seulement les titres etc... Cela nécessite évidement que l'utilisateur utilises les styles "standard" de Word 2007.

Je me suis donc lancé sur la création d'un convertisseur docx vers HTML, après quelques cours sur le fonctionnement du format OpenXML (merci Neodante) j'ai commencé un proto et j'ai eu quelques choses de fonctionnels très rapidement (un week end (de geeks...)) puis une semaine (les soirs) pour avoir quelques choses de correct, travailler avec OpenXML avec .net 3 est vraiment très simple et rapide.

Depuis une semaine ce nouveau système est en production sur TechnoS-SourceS en plus de la classique FreeTextBox. Attention il s'agit d'un service beta (Web 2.0 ? ;-)) donc il est possible qu'il y ait quelques problèmes ...

Voici une démo du projet :

Vous trouverez en pièce jointe de ce post les slides de ma présentation et bientôt en WebCast.


Petit update : je viens de voir le post de Doug Mahugh le product manager d'OpenXML qui était présent avec nous lors de cette démo : Vive la Révolution Open XML

Posted: lundi 11 décembre 2006 00:35 par cyril
Attachment(s): Docx2HTML.pptx
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :

Commentaires

coq a dit :

Ah ba voilà :-)

Bravo, j'attend le webcast du coup.

# décembre 11, 2006 07:59

Bidou a dit :

Quand ça fonctionnera bien, faudra voir pour l'importer sous CodeS-SourceS ;-)

Bon boulot!

# décembre 11, 2006 10:13

Benjiiim a dit :

Est-ce que ce projet passera un jour open source ?

Tu nous a fais envi là ! :-)

# décembre 11, 2006 13:49

cyril a dit :

Pour l'instant le projet n'est pas Open-Source car trop "beta" plus tard ce projet sera surement disponible mais je ne sais pas encore la licence que je vais utiliser.

# décembre 11, 2006 14:10

malek a dit :

Tu as adopte finalement toi aussi la "beta" experiences ;O)

# décembre 12, 2006 21:02

cyril a dit :

Non je fais des application "Web 2.0", quid de beta ?

# décembre 12, 2006 21:36

malek a dit :

c'etait une boutade :b ...

# décembre 13, 2006 08:12

tja a dit :

Quel logiciel utilises-tu pour les gifs animées ?

# septembre 10, 2009 14:29
Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- Office 365: Script PowerShell pour auditer l’usage des Office Groups de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 11:02

- Office 365: Script PowerShell pour auditer l’usage de Microsoft Teams de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 10:39

- Office 365: Script PowerShell pour auditer l’usage de OneDrive for Business de votre tenant par Blog Technique de Romelard Fabrice le 04-25-2019, 15:13

- Office 365: Script PowerShell pour auditer l’usage de SharePoint Online de votre tenant par Blog Technique de Romelard Fabrice le 02-27-2019, 13:39

- Office 365: Script PowerShell pour auditer l’usage d’Exchange Online de votre tenant par Blog Technique de Romelard Fabrice le 02-25-2019, 15:07

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Stream Portal par Blog Technique de Romelard Fabrice le 02-21-2019, 17:56

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Video Portal par Blog Technique de Romelard Fabrice le 02-18-2019, 18:56

- Office 365: Script PowerShell pour extraire les Audit Log basés sur des filtres fournis par Blog Technique de Romelard Fabrice le 01-28-2019, 16:13

- SharePoint Online: Script PowerShell pour désactiver l’Option IRM des sites SPO non autorisés par Blog Technique de Romelard Fabrice le 12-14-2018, 13:01

- SharePoint Online: Script PowerShell pour supprimer une colonne dans tous les sites d’une collection par Blog Technique de Romelard Fabrice le 11-27-2018, 18:01