Des .doc en .html sans bavure
mars 29, 2011
Une procédure simple (et rapide) pour convertir tout type de document (bureautique et autre) en html sans “exploser” la mise en page.
Si si, c’est possible…
A éviter
Si vous enregistrez un .doc en .html dans un traitement de texte, vous vous apercevrez rapidement que la mise en page est devenue baroque : tout est placé en désordre .
Bref, c’est pas ça…
Une solution
Après de nombreux essais de convertisseurs de document vers du html, je me suis rendu compte que les meilleurs résultats obtenus étaient ceux utilisant des documents enregistrés en pdf.
La recette
Traitons un exemple pratique : transformons un .doc (ou .odf ) en .html
Les ingrédients :
- une imprimante pdf ( CutePDF, PDFcreator, etc…)
- http://pdf.investintech.com/
La procédure :
- Imprimer votre document en pdf (recommandé en format A3, sinon c’est trop petit sur l’écran ; faites des essais, vous verrez)
- Charger votre pdf sur le site http://pdf.investintech.com/ (“STEP 1″)
- Lancer la conversion (“STEP 2″)
- Une fois la conversion terminée, ouvrez le lien produit et enregistrer votre fichier html depuis le navigateur (sans espace, sans accent SVP)
- Éditer votre source html avec un éditeur de texte pour enlever les bordures (si vous le souhaitez) en supprimant les entrées ” border-style:outset; ” dans le fichier html.
- C’est tout !
Conclusion
C’est du 95% parfait : le résultat est très proche du document original.
Vous pouvez faire des essais avec différents formats (le A2 en portrait passe bien sur les écrans en 1200 et +) avec des pdf en différentes qualités d’impression.
Essayer le logiciel able2extract dans sa version poste. Il permet (non testé) de faire d’autres types de conversion (version d’essais en chargement gratuit).
Un autre logiciel a aussi donné des résultats corrects : PDF to HTML v2.0 .
N’hésitez pas à partager votre méthode dans la rubrique commentaire
Bonnes conversions !
mars 30, 2011 at 1:19
Merci pour l’info, ça peut être utile.
Pendant un temps, j’utilisais Word2CleanHTML (http://word2cleanhtml.com/), mais maintenant j’utilise CKEditor (http://ckeditor.com/demo), que je peux utiliser même hors ligne.
Emmanuel
avril 2, 2011 at 6:53
L’intérêt principal de able2extract est qu’il reste fidèle dans la mise en page dans le sens pdf vers html.
Comme il est simple de produire un pdf dont la mise en page est identique à celle d’un .doc, la boucle est bouclée…
Je vais tester ckeditor, ça à l’air sympa.
mars 30, 2011 at 6:30
avec des photos d’écran c’est tellement mieux !