Il processo
di scansione e riconoscimento
Fin qui abbiamo cercato di capire come lavora Finereader affrontando un passo alla volta ciò che il programma è in grado di fare seguendo l’intero processo o parti accorpate di esso.
Abbiamo visto come scandire una pagina e poi come farla riconoscere. Infine abbiamo fatto in modo che il lavoro venisse esportato in un editor (per ora solo Microsoft Word, ma vedremo che lo si può fare anche con altre applicazioni).
Dal menu principale, raggiungiamo la voce <processo>[1].
Esaminiamo, come al solito, la tendina.
Scan&Read |
Open&Read |
Aggiungi immagini |
Leggi |
Controllo ortografico |
Salva risultati |
Operazioni automatiche |
Avvia riconoscimento in background |
Interrompi riconoscimento in background |
Continuo a chiedermi, alla quinta versione che conosco di questo programma, come mai le prime due righe di questo menu non sono mai state tradotte in italiano. E dire che non era difficile!
La prima significa: “Scandisci e leggi”. La seconda: “Apri e leggi”.
Iniziamo dalla prima poiché, dato quello che sappiamo già, non ci risulta difficile capire a cosa serve.
Questo comando, una volta collocata la pagina sullo scanner, fa partire la scansione e, finita questa, analizza il file immagine salvato. Se verifica l’esistenza di cose che gli paiono caratteri alfabetici, li traduce in testo.
Se sullo scanner abbiamo messo una cartolina del Colosseo o del Vesuvio col pennacchio, il risultato dovrebbe essere nullo. Ma sarà per voi divertente verificare che FR si sforza sempre di produrre qualcosa. E così una forma rotondeggiante sarà tradotta in O, una serpentina in S, e da lì in poi lasciate pur fare alla sua fantasia. Dal nostro punto di vista, meglio un attivista che un rinunciatario. Per cui potremo successivamente togliere ciò che non serve, piuttosto che piangere per eventuali mancanze.
Ripetiamo. FR prima realizza un’immagine e la salva, quindi la riconosce. Ricordate i comandi <control+k> e <control+R>?
Ma questo vuol dire che sul mio PC ci potrebbero essere dei files di sola immagine non riconosciuti! Esattamente così. E non è nemmeno detto che quei files immagine siano stati prodotti da Finereader…
Ecco alcune comuni estensioni che ci dicono trattarsi di un file d’immagine.
Bmp, dcx, jpg, png, pcx, tif.
Sono formati che hanno origini, destinazioni, dimensioni, motivazioni e usi differenti. Ma di questo, qui non ci occupiamo perché nel caso nostro quei files sono da interpretare e non da produrre.
Analogo discorso vale per i files pdf, che non rientrano esattamente nella stessa categoria, ma che ci si possono presentare anche come sola immagine dinanzi alla quale nulla può il più potente screen reader.
Quindi eccoci alla seconda riga del <menu/processo>: <open&read>, apri e leggi.
A questo comando, si apre una finestra di risorse nella quale andremo a scovare e selezionare il file che c’interessa leggere.
Ciò che accade poi, ci sembrerà di averlo già visto. Infatti altro non è che ciò che vediamo dando il comando >leggi>. Nella finestra del batch si aggiungeranno nuove righe con la specificazione che sono state riconosciute. E cosa farne lo abbiamo già detto.
Andiamo ora alla terza riga del <menu/processo>: <aggiungi immagini>.
Manda a un sottomenu le cui righe ci sembra di aver già visto da qualche altra parte. Sono esattamente le stesse prime tre righe del <menu/file>:
Apri PDF/immagine... Ctrl+O |
Scandisci immagine... Ctrl+K |
Interrompi scansione Esc |
Non è l’unico caso, come vedremo. Ma perché lo han fatto?
Ebbè, così come esiste l’eterno gioco fra guardie e ladri, esiste anche quello tra programmatori e utilizzatori. Ed è basato – mi sembra – sulla sottostima dell’intelligenza altrui. Dunque, non una guida basata su logiche condivise, ma una sovresposizione di merci; per la serie: più cose ci sono, più cose si trovano.
Ad esempio, perché scrivere: “apri pdf/immagine”? È che i redattori dell’interfaccia ci hanno tenuto a far sapere che FR legge anche i pdf. In realtà lo faceva anche la versione precedente. Ma, a loro giudizio, forse l’utente medio non se ne era accorto.
Intendiamoci! Fastidio non dà. Però ingenera nell’utilizzatore poco alfabetizzato l’idea che il pdf sia qualcosa di diverso, di speciale, e quidi da specificare.
Sia come sia, sui pdf dovremo tornare.
Le righe a seguire, del <menu/processo>, o sono intuitive – come <leggi> - o immaginabili – come <controllo ortografico> -. Per ora le trascuriamo per passare alle ultime due.
Una <avvia il riconoscimento in bacground>, l’altra lo interrompe.
Ma di che si tratta?
Con i processori veloci che usiamo oggi, oramai non ci rendiamo più conto di certe cose. Il processo di OCR è in realtà molto impegnativo per il processore, per cui le vecchie macchine richiedevano un certo tempo per finire il lavoro. Chi aveva per le mani un libro da scansionare, poteva aver bisogno di parecchio tempo tra una pagina e l’altra. I processi in bacground – ne fanno uso anche le stampanti, ad esempio – consentono di rimandare l’operazione a un momento in cui la CPU non è o è meno impegnata. Nel nostro caso, avviamo soltanto la scansione della pagina - <control+k> e continuiamo a girar pagine senza problemi. Saprà lui, FR, quando è il tempo di lavorare al riconoscimento.
Certo, sulle macchine di ultima o anche di penultima generazione, il tempo di riconoscimento è talmente breve, da compiersi nell’intervallo che ci occorre per sistemare la nuova pagina. C’è tuttavia qualcuno affezionato alla vecchia modalità.
Sappiamo che esiste e ne faremo uso come, se e quando crederemo.
Vai a Lezione 4
[1] Tramite Jaws verremo a sapere che la lettera sottolineata è la <p>. Dunque, per andare al <menu/processo> basterà digitare <alt,p>. Questo metodo valga d’ora in poi per tutti i comandi.