Qu`est-ce que c`est ? Installation:

Transcription

Qu`est-ce que c`est ? Installation:
SimpleOCR, un logiciel gratuit de reconnaissance de caractères
Qu'est-ce que c'est ?
Si vous possédez un scanneur, vous avez sans doute déjà scanné des pages de livres contenant du
texte et été surpris de ne pas pouvoir modifier ce texte.
Lorsque vous numérisez un texte, votre scanneur le considère comme une image et le traite en tant
que tel; vous obtenez un fichier qui ne peut être vu et modifié qu'avec un logiciel de dessin.
Un logiciel de reconnaissance de caractères va traiter l'image fournie par votre scanneur pour
rechercher le texte qu'il contient et le transformer en un fichier texte (que vous pourrez éditer et
modifier avec un traitement de texte)
Installation:
lancez votre navigateur, allez à l'adresse:
http://www.simpleocr.com
sur la page d'accueil, cliquez sur
Get the simpleOCR application for free
Puis dans la partie droite, cliquez sur
Download SimpleOCR, a
fully-features, free OCR
Une fenêtre s'ouvre vous proposant d'enregistrer ou d'ouvrir le fichier InstSocr.exe, choisissez
enregistrer, sélectionnez le dossier mes documents et cliquez sur enregistrer..
Le téléchargement commence. Quand il est terminé, fermez votre navigateur et retournez dans le
dossier mes documents, recherchez le fichier InstSocr.exe et double-cliquez sur son icône.
Vous obtenez les écrans suivants:
Cliquez sur Next
I Agree
Next
Cliquez sur Next
puis Finish
Vous avez installé SimpleOCR
Utilisation
sur le bureau de Windows, cliquez sur l'icone:
Sur l'écran qui s'affiche, choisissez
Machine Print
L'écran suivant vous invite à démarrer une démonstration du programme, vous n'en aurez pas besoin
, cliquez sur OK et lisez la suite.Vous arrivez sur l'écran suivant:
Sélectionnez la langue dans laquelle vous voulez travailler (le français est disponible!).
Vous accédez à l'écran principal.
Choisissez votre scanneur dans le menu File sur la ligne Select Scanner
puis cliquez sur le bouton Add Page (en haut à à droite)
Vous obtenez le menu suivant qui vous propose de choisir la page à reconnaître
– soit à partir du scanneur directement (première ligne: Scanner),
– - soit à partir d'un fichier déjà numérisé (deuxième ligne: File),
– Les autres options n'ont pas été testées mais elle concernent respectivement la reconnaissance à
partir une série d'images au format TIF, une série d'images (format Ink) ou directement à npartir
d'une tablette graphique
Choisissez Scanner et cliquez sur OK.
A partir de là, le processus de numérisation
démarre, les écrans dépendent de votre
scanneur. Si rien ne se passe, vérifiez (dans
l'ordre) que le scanneur soit branché et allumé,
qu'il soit connecté à votre PC, qu'il fonctionne
en mode TWAIN *
Une fois le document numérisé, vous obtenez
l'image de ce document:
Vous devez alors
sélectionner les zones de
l'image qui devront être
traitées par le logiciel de
reconnaissance.
Pour cela, utilisez le bouton de sélection de zone d'image pour indiquer que vous
souhaitez intégrer une image à un endroit du texte (exemple: conserver la photographie
illustrant un article)
Utilisez le bouton de zone à ignorer pour indiquer au programme quelle(s) zone(s) vous ne
souhaitez pas voir traitée(s) par le logiciel; les zones sélectionnées seront ignorées (utile
quand vous ne souhaitez reconnaitre qu'un article dans une page de magazine).
Si vous avez sélectionné une zone que vous souhaitez effacer, utilisez le bouton.
Une fois ce travail effectué, lancez la reconnaissance en utilisant le bouton
La phase de reconnaissance démarre. La zone en jaune est la zone traitée, En haut vous voyez
l'image du document et dans la fenêtre du bas, le document tel qu'il a été reconnu. Les mots en bleu
sont le mots dont le logiciel n'est pas sûr, il vous faudra les accepter ou les modifier pour pouvoir
enregistrer votre document.
Pour accepter un mot, cliquez sur Accept (ou appuyez sur la touche entrée), pour ignorer un mot,
choisissez Decide later, et pour conserver le mot comme image (sans intervention ultérieure
possible) choisissez Keep as image.
Vous pouvez décider au fur et à mesure des propositions faites par le logiciel, ou anticiper en
cliquant directement sur un mot en bleu. Une liste de mots suggérés apparaît alors et il vous suffit
de choisir le mot dans la liste pour le remplacer.
Une fois votre texte validé, vous obtenez l'écran suivant:
Choisissez Save Document as....pour nommer votre fichier et l'enrigistrer dans un format qu'il vous
sera possible d'ouvrir avec un traitement de texte.
.
Le dernier écran vous demande ce que vous souhaitez faire ensuite: choisissez
Open in default Word Processor pour ouvrir votre document avec votre traitement de texte.
Do not Open Word Processor pour:
Démarrer une nouvelle session de numérisation (Start a new session)
Rester dans la session courante (Stay in current session)
Fermer et revenir à Windows (Close)
1
1*A propos de la norme TWAIN:
Consultez la documentation de votre scanneur, il doit figurer cette indication:
scanneur compatible TWAIN.
Pour le tester,
• Avec Windows 98
Téléchargez photofiltre à l'adresse:http://page-antonio.chez.tiscali.fr/utils/pf-setup.exe
lancez le programme téléchargé et une fois l'installation terminée, lancer photofiltre, et dans le menu fichier,
choisissez importation TWAIN puis numérisez une image.
• Avec windows XP
Ouvrez Paint, le logiciel de dessin fourni avec Windows XP, allez dans le menu fichier, et choisissez d'un scanneur ou
d'un appareil photo, si le scanneur ne fonctionne pas, réinstallez les pilotes à l'aide du cédérom ou de la disquette
d'installation.