PDFpen logo PDFpen logo

Aiuto: OCR (= ROC - Riconoscimento ottico dei caratteri)

OCR (Riconoscimento Ottico dei Caratteri) è il processo di conversione da un'immagine bitmap contenente testo (come la fotocopia di un vecchio libro) ad un testo che può essere selezionato, copiato e ricercato da PDFpen o da altri editor di testo. Una volta che il testo viene riconosciuto dall'OCR, viene messo su un livello invisibile sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile. La Tecnologia OCR non produce un rendering perfetto del testo dall'immagine. Sarà necessario controllare e correggere il testo analizzato dall'OCR.


Usare l'OCR in PDFpen

  1. Apri un file scannerizzato in PDFpen.
  2. Apparirà un messaggio di avvertimento
    "Questo documento sembra essere scannerizzato. Vuoi eseguire l'operazione di OCR (optical character recognition)? L'OCR ti permetterà di selezionare il testo."
    Ci sono tre opzioni:
    • Annulla:
      Non verrà eseguito l'OCR
    • Pagina OCR:
      Verrà eseguito l'OCR sulla pagina corrente.
    • Documento OCR:
      Se il tuo documento è composto da più pagine, verrà eseguito l'OCR su tutte le pagine.

    Scegli le lingue che dovranno essere riconosciute dall'OCR in Preferenze > OCR.

Durante il processo di OCR apparirà una barra di progressione. L'operazione potrebbe richiedere alcuni secondi o più tempo, dipende dalla dimensione e dal contenuto del documento scannerizzato.
Per eseguire l'OCR manualmente, seleziona Composizione > OCR Pagina. PDFpen inizierà il processo di OCR ed apparirà la barra di progressione.

OCR multipli

Esegui l'OCR su più documenti alla volta.

 

ocr files window

 

  1. Dalla barra dei menu, seleziona File > File OCR.
  2. Nella finestra File OCR, seleziona i documenti su cui eseguire l'OCR. È possibile trascinare i file sulla finestra, o scegliere Aggiungi PDF.
  3. Una volta che la lista di documenti è pronta, cliccare su Esegui OCR.

Progresso

Al completamento di ogni file, il suo indicatore di progresso diventa verde, indicando il buon esito. Giallo o rosso indica che il processo di OCR non è andato a buon fine. Se un cerchio giallo o rosso appare accanto al nome del file, puoi riprovare o inviare il documento al nostroto al supporto per ricevere assistenza.

I documenti verranno processati in background mentre si continua a lavorare su PDFpen. È possibile aggiungere altri documenti alla lista in qualsiasi momento. Ogni documento viene ripristinato al suo file originale.

L'OCR continua anche se si chiude la finestra. È possibile riaprire la finestra da File > File OCR.

Un suono verrà riprodotto una volta che la lista sarà completata. Una lista di file completati rimane nella finestra. È possibile rimuovere le voci completate tramite Rimuovi.

Selezionare, Copiare e Correggere Testo

Una volta che il processo di Riconoscimento Ottico dei Caratteri è finito, il testo del documento può essere modificato come ogni altro testo. Per rendere visibili le correzioni al testo, utilizzare Correggi Testo. Maggiori dettagli in Lavorare con il Testo..

Cercare il testo OCR

Il testo generato dall'operazione di OCR può essere cercato come un testo normale. Vedi Cercare dentro un PDF.

Consigli per migliorare i risultati dell'OCR nei tuoi documenti:

  • La qualità del tuo documento originale influenzerà la qualità delle performance dell'OCR. Testo pulito e nitido produrrà risultati migliori piuttosto che fotocopie stropicciate e sbiadite.
  • Inserisci il tuo documento nello scanner il più dritto possibile. Se hai un documento già scannerizzato ruotato, puoi "equalizzare", ossia raddrizzare, l'immagine in PDFpen mediante il comando del menu Composizione > Equalizza ed Imposta Immagine
  • Aumenta il contrasto del tuo documento scannerizzato in modo da rendere lo sfondo il più bianco possibile. Puoi impostare il contrasto dell'immagine mediante il comando del menu Composizione > Equalizza ed Imposta Immagine

Forza OCR

PDFpen analizza il documento e se rileva un'immagine della stessa dimensione della pagina, suppone che il documento sia uan scansione ed automaticamente chiede di effettuare un OCR. In alcuni casi, PDFpen potrebbe non riconoscere un documento scansionato. Nel menu Modifica, Pagina OCR sarà grigio e non selezionabile.

  1. Tieni premuti i tasti Comando ed Opzione insieme.
  2. Scegli Modifica > Pagina OCR dal menu.

Visualizzare il Livello di Testo OCR

Una volta che il testo è stato riconosciuto dall'OCR, viene messo su un livello invisibile posto sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile.

Il testo risultante dal processo di OCR risulta da un rendering molto preciso, ma non perfetto, del testo presente nell'immagine. Potrebbe essere necessario ricontrollare e correggere il testo dopo l'analisi OCR. Copiando ed incollando il testo OCR, si potrebbero notare delle imprecisioni opportunamente correggibili.

Mostra il livello di testo OCR:

  1. Dal menu Visualizza, scegliere Livello OCR. Un livello di testo apparirà sul documento mostrando il testo OCR normalmente nascosto.

Rimuovi il livello OCR

Per rimuovere completamente il livello OCR da una pagina:

  1. Apri il menu Modifica e scegli Rimuovi Livello OCR… (Cmd+Opt+O).

A questo punto, potresti rifare l'OCR, oppure utilizzare il documento nello stato corrente. Se vuoi rimuovere l'OCR da un documento per rifarlo, è possibile utilizzare Forza OCR.

Modificare il Livello di Testo OCR (PDFpenPro Only)

Effettuare correzioni al Livello di Testo OCR.

  1. Dal menu Visualizza, "scegliere visualizza informazioni OCR". Un livello di testo apparirà sul documento, mostrando il testo OCR normalmente nascosto.
  2. Selezionando una porzione di testo apparirà una finestra di popup con opzioni per modificare il testo una parola o riga per volta.

I cambiamenti effettuati al Livello di Testo OCR non sono gli stessi effettuati utilizzando lo strumento Correggi Testo dal momento che i cambiamenti al Livello di Testo OCR non avvengono anche al testo visibile.

Inoltre, lo strumento Correggi Testo è adatto alla correzione di piccoli errori, e non per la riformattazione di un documento. Per fare ciò, bisogna esportare il documento in formato Word, ed effettuare i cambiamenti in un word processor.

Dizionari ed OCR

PDFpen’s ora include dizionari medici e legali nel motore OCR per migliorare la qualità del risultato del riconoscimento ottico del testo per i documenti scansionati riconoscendo parole specifiche delle professioni mediche e legali. Questa caratteristica è inclusa nel software, e non c’è bisogno di abilitare o cambiare alcuna impostazione. Se scegli di modificare del testo riconosciuto otticamente, le parole non corrette saranno mostrate con una barra rossa ondulata.




© 2003-2020 SmileOnMyMac, LLC dba Smile. All rights reserved.
PDFpen and PDFpenPro are registered trademarks of Smile. The Smile logo is a trademark of Smile.