Kuvan kääntäminen tekstiksi ABBYY FineReaderin avulla?

Tämä artikkeli on edellisen lisäksi (ja yksityiskohtaisemmin paljastaa suoran tekstin tunnistamisen olemuksen).

Aloitetaan olennaisesti, jota monet käyttäjät eivät ymmärrä.

Kun olet skannannut kirjan, sanomalehden, aikakauslehden jne., Saat joukon kuvia (eli graafisia tiedostoja, ei tekstitiedostoja), jotka on tunnistettava erityisessä ohjelmassa (yksi parhaista tähän on ABBYY FineReader). Tunnustaminen - tämä on prosessi, jossa saadaan tekstiä grafiikasta, ja juuri tämä prosessi kirjoitetaan yksityiskohtaisemmin.

Esimerkkinä esitän kuvakaappauksen tästä sivustosta ja yritän saada sen tekstistä.

1) Tiedoston avaaminen

Avaa kuva, jonka aiot tunnistaa.

Muuten, tässä on syytä huomata, että voit avata paitsi kuvamuotoja myös DJVU- ja PDF-tiedostoja. Näin voit nopeasti tunnistaa koko kirjan, joka verkon kautta on yleensä jaettu näihin formaatteihin.

2) Muokkaus

Heti hyväksy automaattinen tunnistaminen ei ole järkevää. Jos tietysti sinulla on kirja, jossa vain teksti, kuvat ja tabletit sekä skannatut erinomaista laatua, niin voit. Muissa tapauksissa on parempi asettaa kaikki alueet manuaalisesti.

Yleensä sinun täytyy ensin poistaa tarpeettomat alueet sivulta. Voit tehdä tämän napsauttamalla paneelin muokkauspainiketta.

Sitten sinun täytyy jättää vain alue, jolla haluat työskennellä pidempään. Tätä varten on työkalu tarpeettomien rajojen leikkaamiseen. Valitse tila oikeassa sarakkeessa. katkaista.

Valitse seuraavaksi alue, jonka haluat lähteä. Alla olevassa kuvassa se on korostettu punaisella.

Muuten, jos sinulla on useita kuvia, voit hakea rajausta kaikkiin kuviin kerralla! Kätevä olla leikkaamatta kukin erikseen. Huomaa, että tämän paneelin alaosassa on toinen suuri työkalu -pyyhekumi. Sen avulla voit poistaa tarpeettomat avioerot, sivunumerot, täplät, tarpeettomat erikoismerkit ja yksittäiset osiot kuvasta.

Kun olet leikannut reunat, alkuperäisen kuvan pitäisi muuttua: vain työtila säilyy.

Sitten voit poistua kuvankäsittelyohjelmasta.

3) Alueiden valinta

Paneelissa avoimen kuvan yläpuolella on pieniä suorakulmioita, jotka määrittävät skannausalueen. Niitä on useita, tarkastellaan lyhyesti yleisimpiä.

Kuva - ohjelma ei tunnista tätä aluetta, se kopioi määritetyn suorakulmion ja liittää sen tunnistettuun asiakirjaan.

Teksti on pääalue, johon ohjelma keskittyy ja yrittää saada tekstiä kuvasta. Korostamme tämän alueen esimerkissämme.

Valinnan jälkeen alue on maalattu vaaleanvihreällä värillä. Sitten voit siirtyä seuraavaan vaiheeseen.

4) tekstin tunnistaminen

Kun kaikki alueet on asetettu, napsauta valikkokomentoa tunnistaaksesi. Onneksi tässä vaiheessa ei tarvita mitään muuta.

Tunnistusaika riippuu asiakirjojen sivujen määrästä ja tietokoneen tehosta.

Keskimäärin yksi hyvälaatuista skannattua sivua kestää 10-20 sekuntia. PC: n keskimääräinen teho (nykyisten standardien mukaan).

 

5) Virheiden tarkistaminen

Riippumatta kuvien alkuperäisestä laadusta on yleensä virheitä tunnistamisen jälkeen. Kaiken kaikkiaan tähän mennessä mikään ohjelma ei voi täysin poistaa henkilön työtä.

Napsauta kassavaihtoehtoa ja ABBYY FineReader aloittaa julkaisemisen teille omassa paikassaan, missä hän kompastui. Tehtäväsi, vertaamalla alkuperäistä kuvaa (muuten, se näyttää sinulle tämän paikan laajennetussa versiossa) ja tunnustuksen muunnelman - vastaamaan myöntävästi tai korjaamaan ja hyväksymään. Sitten ohjelma siirtyy seuraavaan vaikeaan paikkaan ja niin edelleen, kunnes koko asiakirja on tarkistettu.

Yleensä tämä prosessi voi olla pitkä ja tylsä ​​...

6) Säilytys

ABBYY FineReader tarjoaa useita vaihtoehtoja työn tallentamiseen. Useimmin käytetty on "tarkka kopio". eli koko asiakirja, siinä oleva teksti, muotoillaan samalla tavalla kuin lähteessä. Joten teimme tässä esimerkissä.

Tämän jälkeen näet tunnistetun tekstin tutulla Word-asiakirjalla. Mielestäni ei ole mitään järkeä kuvailla, mitä tehdä sen kanssa ...

Näin ollen olemme analysoineet konkreettisella esimerkillä, miten kääntää kuva tavalliseksi tekstiksi. Tämä prosessi ei ole aina yksinkertainen ja nopea.

Joka tapauksessa kaikki riippuu alkuperäisestä kuvanlaadusta, kokemuksesta ja tietokoneen nopeudesta.

Hyvää työtä!