Qu`est-ce que c`est ? Installation:
Transcription
Qu`est-ce que c`est ? Installation:
SimpleOCR, un logiciel gratuit de reconnaissance de caractères Qu'est-ce que c'est ? Si vous possédez un scanneur, vous avez sans doute déjà scanné des pages de livres contenant du texte et été surpris de ne pas pouvoir modifier ce texte. Lorsque vous numérisez un texte, votre scanneur le considère comme une image et le traite en tant que tel; vous obtenez un fichier qui ne peut être vu et modifié qu'avec un logiciel de dessin. Un logiciel de reconnaissance de caractères va traiter l'image fournie par votre scanneur pour rechercher le texte qu'il contient et le transformer en un fichier texte (que vous pourrez éditer et modifier avec un traitement de texte) Installation: lancez votre navigateur, allez à l'adresse: http://www.simpleocr.com sur la page d'accueil, cliquez sur Get the simpleOCR application for free Puis dans la partie droite, cliquez sur Download SimpleOCR, a fully-features, free OCR Une fenêtre s'ouvre vous proposant d'enregistrer ou d'ouvrir le fichier InstSocr.exe, choisissez enregistrer, sélectionnez le dossier mes documents et cliquez sur enregistrer.. Le téléchargement commence. Quand il est terminé, fermez votre navigateur et retournez dans le dossier mes documents, recherchez le fichier InstSocr.exe et double-cliquez sur son icône. Vous obtenez les écrans suivants: Cliquez sur Next I Agree Next Cliquez sur Next puis Finish Vous avez installé SimpleOCR Utilisation sur le bureau de Windows, cliquez sur l'icone: Sur l'écran qui s'affiche, choisissez Machine Print L'écran suivant vous invite à démarrer une démonstration du programme, vous n'en aurez pas besoin , cliquez sur OK et lisez la suite.Vous arrivez sur l'écran suivant: Sélectionnez la langue dans laquelle vous voulez travailler (le français est disponible!). Vous accédez à l'écran principal. Choisissez votre scanneur dans le menu File sur la ligne Select Scanner puis cliquez sur le bouton Add Page (en haut à à droite) Vous obtenez le menu suivant qui vous propose de choisir la page à reconnaître – soit à partir du scanneur directement (première ligne: Scanner), – - soit à partir d'un fichier déjà numérisé (deuxième ligne: File), – Les autres options n'ont pas été testées mais elle concernent respectivement la reconnaissance à partir une série d'images au format TIF, une série d'images (format Ink) ou directement à npartir d'une tablette graphique Choisissez Scanner et cliquez sur OK. A partir de là, le processus de numérisation démarre, les écrans dépendent de votre scanneur. Si rien ne se passe, vérifiez (dans l'ordre) que le scanneur soit branché et allumé, qu'il soit connecté à votre PC, qu'il fonctionne en mode TWAIN * Une fois le document numérisé, vous obtenez l'image de ce document: Vous devez alors sélectionner les zones de l'image qui devront être traitées par le logiciel de reconnaissance. Pour cela, utilisez le bouton de sélection de zone d'image pour indiquer que vous souhaitez intégrer une image à un endroit du texte (exemple: conserver la photographie illustrant un article) Utilisez le bouton de zone à ignorer pour indiquer au programme quelle(s) zone(s) vous ne souhaitez pas voir traitée(s) par le logiciel; les zones sélectionnées seront ignorées (utile quand vous ne souhaitez reconnaitre qu'un article dans une page de magazine). Si vous avez sélectionné une zone que vous souhaitez effacer, utilisez le bouton. Une fois ce travail effectué, lancez la reconnaissance en utilisant le bouton La phase de reconnaissance démarre. La zone en jaune est la zone traitée, En haut vous voyez l'image du document et dans la fenêtre du bas, le document tel qu'il a été reconnu. Les mots en bleu sont le mots dont le logiciel n'est pas sûr, il vous faudra les accepter ou les modifier pour pouvoir enregistrer votre document. Pour accepter un mot, cliquez sur Accept (ou appuyez sur la touche entrée), pour ignorer un mot, choisissez Decide later, et pour conserver le mot comme image (sans intervention ultérieure possible) choisissez Keep as image. Vous pouvez décider au fur et à mesure des propositions faites par le logiciel, ou anticiper en cliquant directement sur un mot en bleu. Une liste de mots suggérés apparaît alors et il vous suffit de choisir le mot dans la liste pour le remplacer. Une fois votre texte validé, vous obtenez l'écran suivant: Choisissez Save Document as....pour nommer votre fichier et l'enrigistrer dans un format qu'il vous sera possible d'ouvrir avec un traitement de texte. . Le dernier écran vous demande ce que vous souhaitez faire ensuite: choisissez Open in default Word Processor pour ouvrir votre document avec votre traitement de texte. Do not Open Word Processor pour: Démarrer une nouvelle session de numérisation (Start a new session) Rester dans la session courante (Stay in current session) Fermer et revenir à Windows (Close) 1 1*A propos de la norme TWAIN: Consultez la documentation de votre scanneur, il doit figurer cette indication: scanneur compatible TWAIN. Pour le tester, • Avec Windows 98 Téléchargez photofiltre à l'adresse:http://page-antonio.chez.tiscali.fr/utils/pf-setup.exe lancez le programme téléchargé et une fois l'installation terminée, lancer photofiltre, et dans le menu fichier, choisissez importation TWAIN puis numérisez une image. • Avec windows XP Ouvrez Paint, le logiciel de dessin fourni avec Windows XP, allez dans le menu fichier, et choisissez d'un scanneur ou d'un appareil photo, si le scanneur ne fonctionne pas, réinstallez les pilotes à l'aide du cédérom ou de la disquette d'installation.