Des .doc en .html sans bavure

mars 29, 2011

Une procédure simple (et rapide) pour convertir tout type de document (bureautique et autre) en html sans “exploser” la mise en page.

Si si, c’est possible…

A éviter

Si vous enregistrez  un .doc en .html dans un traitement de texte, vous vous apercevrez rapidement que la mise en page est devenue baroque : tout est placé en désordre .

Bref, c’est pas ça…

Une solution

Après de nombreux essais de convertisseurs de document vers du html,  je me suis rendu compte que les meilleurs résultats obtenus étaient ceux utilisant des documents enregistrés en pdf.

La recette

Traitons un exemple pratique : transformons un .doc (ou .odf ) en .html

Les ingrédients :

La procédure :

  1. Imprimer votre document en pdf (recommandé en format A3, sinon c’est trop petit sur l’écran ; faites des essais, vous verrez)
  2. Charger votre pdf sur le site http://pdf.investintech.com/ (“STEP 1″)
  3. Lancer la conversion (“STEP 2″)
  4. Une fois la conversion terminée, ouvrez le lien produit et enregistrer votre fichier html depuis le navigateur (sans espace, sans accent SVP)
  5. Éditer votre source html avec un éditeur de texte pour enlever les bordures (si vous le souhaitez) en supprimant les entrées ” border-style:outset; ” dans le fichier html.
  6. C’est tout !

Conclusion

C’est du 95% parfait : le résultat est très proche du document original.

Vous pouvez faire des essais avec différents formats (le A2 en portrait passe bien sur les écrans en 1200 et +) avec des pdf en différentes qualités d’impression.

Essayer le logiciel able2extract dans sa version poste. Il permet (non testé) de faire d’autres types de conversion (version d’essais en chargement gratuit).

Un autre logiciel a aussi donné des résultats corrects : PDF to HTML v2.0 .

N’hésitez pas à partager votre méthode dans la rubrique commentaire ;-)

Bonnes conversions !

3 Responses to “Des .doc en .html sans bavure”


  1. Merci pour l’info, ça peut être utile.
    Pendant un temps, j’utilisais Word2CleanHTML (http://word2cleanhtml.com/), mais maintenant j’utilise CKEditor (http://ckeditor.com/demo), que je peux utiliser même hors ligne.
    Emmanuel

    • Samedi14 Says:

      L’intérêt principal de able2extract est qu’il reste fidèle dans la mise en page dans le sens pdf vers html.
      Comme il est simple de produire un pdf dont la mise en page est identique à celle d’un .doc, la boucle est bouclée…
      Je vais tester ckeditor, ça à l’air sympa.

  2. soopa Says:

    avec des photos d’écran c’est tellement mieux !


Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Twitter picture

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Connexion à %s

Suivre

Get every new post delivered to your Inbox.