Tots els temes

+
Home > Recursos > PDF > coneixement de reconeixement òptic de caràcters (OCR)

Coneixement de reconeixement òptic de caràcters (OCR)

Què és OCR?

Reconeixement òptic de caràcters, normalment s'abreuja en OCR, és la traducció mecànica o electrònica de les imatges escanejades de text manuscrit, escrit a màquina o imprès a text amb codificació màquina.

Per què utilitzar OCR?

OCR és àmpliament utilitzat per convertir els diferents tipus de documents, com documents de paper escanejats, PDF arxius o imatges captades per una càmera digital en dades editables i searchable. En alguns entorns professionals (com ara biblioteques, oficines), milers de llibres i documents són escannejats regularment per a retrocedir i arxiu. Un escàner merament pren fotografies dels documents document original, ocasionant basada en la imatge dels documents escanejats en PDF format. El principal problema amb processament i emmagatzematge d'aquests grans volums de documents escanejats és la incapacitat per cercar una frase específica o nom dins d'un arxiu. També sense text podeu destacar, copiar o modificar, perquè el document conté un arxiu d'imatge gran en lloc de caràcters de text individuals.

OCR Sample

Abans de realitzar l'OCR, tota l'àrea a la pàgina és seleccionat i destacat i sense text pot ser buscat i editat.

Després de realitzar OCR, en aquesta pàgina es poden seleccionar amb eina de selecció, pot buscar i editar caràcters, paraula i paràgrafs fàcilment.

Com eines de PDF OCR Wondershare ajudar?

Wondershare eines de PDF OCR pot ajudar a reconèixer text de PDF escanejat ràpida i precisa i preservar els resultats reconeguts en múltiples formats editables.

Wondershare PDF Editor Pro for Mac: amb pendents OCR precisió i format de preservació, permetrà cercar, corregir i copiar text en PDF escanejat o imatge basada directament en Mac. També permet vostè per exportar a PDF escanejat per text amb format basat en Word, Excel, PowerPoint, EPUB, HTML, i formats de Text.

Wondershare PDF Converter Pro: reconeix el text de PDF escanejat amb la precisió excepcional de OCR i pot convertir diversos arxius PDF escanejats textuals paraula, excel·lir, PowerPoint, EPUB, HTML i Text documentació sobre Windows.


Wondershare PDF Converter Pro for Mac: reconeix el text de PDF escanejat amb la precisió excepcional de OCR i pot convertir diversos arxius PDF escanejats textuals paraula, excel·lir, PowerPoint, EPUB, HTML i Text documentació sobre Mac.

Com millorar la qualitat de OCR reconeixement?

OCR reconeixement qualitat depèn en gran mesura la qualitat de la imatge, que depèn en gran mesura els paràmetres utilitzats durant el procés d'escaneig de document. Per aconseguir millor qualitat OCR reconeixement per als seus documents escanejats, aquests són alguns consells per a escaneig de document:

Tipus de lletra és massa petit
Per obtenir resultats òptims reconeixement, escanejar documents impresos en lletra petita a resolucions més altes.
Podeu especificar la resolució desitjada en la propietat de la resolució de l'objecte ScanSourceSettings .


Imatge font Resolució recomanada
Reader 300 ppp per a textos típics (imprès en lletra de mida 10 pt o més gran)
Reader 400-600 dpi per a textos impresos en lletra més petita (9pt o més petites)

Ajust la brillantor
Pot necessitar ajustar la configuració de brillantor en escannejar en mode en blanc i negre. Podeu especificar la brillantor desitjat a la propietat de la brillantor de l'objecte ScanSourceSettings . Hauria de ser suficient un valor mitjà del 50% en la majoria dels casos.
Si la imatge resultant conté massa "estripat" o "encallat" cartes junts, solucioneu els problemes utilitzant la taula de sota.

Seva imatge semblant a aquesta Recomanacions
Good Quality Aquesta imatge és adequat per al reconeixement
Very Light
caràcters són "estripat" o molt clar
  • Baixar la brillantor per fer la imatge més fosc.
  • Col·loqueu en escala de grisos. Estaré atent brillantor automàticament.
  • Very Dark
    personatges són molt distorsionades, enganxats junts, o omplir
  • Augmentar la brillantor per fer la imatge més brillant
  • Col·loqueu en escala de grisos. Estaré atent brillantor automàticament.
  • Qualitat d'impressió
    Mala qualitat documenta amb "soroll" (és a dir, l'atzar punts negres o taques), lletres borroses i desiguals, o esbiaixada línies i taula desplaçat fronteres poden requerir paràmetres específics d'escaneig. Per exemple, aquest fax i diari:

    Print Quality

    Documents de mala qualitat millor són escannejats en escala de grisos. Quan l'escannejar en escala de grisos, el programa seleccionarà el valor òptim brillantor automàticament.
    El mode escala de grisos conserva més informació sobre les lletres del text escanejades per aconseguir millors resultats reconeixement quan reconeixent documents de mitjana-baixa qualitat.


    Articles relacionats

    Preguntes relacionades amb el producte? Parlar directament amb el nostre equip de suport >>

    Part superior