Skeniranje !
Imam napravo Epson 3850. Moram pa priznati da se preveč dobro na te stvari ne spoznam, kaj pa pomeni ta OCR ? V bistvu ko skeniram izberem dokument in ga shranim z končnico doc. ,vendar ko ga prenese v Word prikaže neke čudne znake. Hvala za kakoršnokoli pomoč saj pišem neka navodila za delo, ki bi jim morala popraviti , tega pa je preko 100 strani tako, da bi mi prav prišlo če bi lahko poskenirala in popravila besedilo !
Joj, joj, kakšne nebuloze pišejo nekateri tukaj. Evo, takole to gre: skener vedno skenira bitno sliko. Če skener softver ima OCR funkcionalnost, bo mogoče znal potegnit besedilo ven, ampak za slovenščino dvomim, vsaj brez nastavljanja ne. Tako da, če imaš skener, ki pač preskenira sliko in ne zna drugega, spravi to sliko na disk kot datoteko. Itak bo že skener softver to naredil, ko boš skenirala. To bo potem slika, kot bi skenirala fotografijo, verjetno JPG, mogoče PNG … ali kar je še teh formatov.
Potem pa pride na vrsto OCR oziroma Optical Character Recognition. OCR softver bo dobljeno sliko analiziral in iz nje razbral besedilo, torej posamezne črke, tako kot če bi jih odtipkala na tipkovnici. Obstaja ogromno takega softvera. Obstajajo tudi online zadeve (nazadnje sem recimo uporabil https://www.newocr.com). Torej ne rabiš nič inštalirat na svoj računalnik, ampak samo greš na stran in upoštevaš navodila. Seveda, če je besedilo varnostno kritično, bo treba delat lokalno na tvojem računalniku. Malo nastaviš, recimo slovenski jezik, če se da, če ne pa pač popraviš ročno. Jaz sem na primer tako preskeniral papirnata navodila za nek izdelek, ki so bila samo v kitajskih pismenkah, naredil OCR in dobil besedilo, še vedno v pismenkah, ampak tokrat kot posamezne znake, in to prekopiral v google translate in prevedel, tako da sem lahko prebral v angleščini (v slovenščino google bolj slabo prevaja, tako da imam angleščino raje).
Odvisno od kvalitete vira in resolucije skeniranja, vsaj 150 dpi je kar priporočljivo, je odvisno,koliko bo treba popravljat dobljeno besedilo. Če je papir pomečkan, besedilo počečkano, popackano, ali kaj podobnega, potem bo rezultat slabši, ampak verjetno vseeno boljši kot pretipkavanje vsega besedila v celoti.
No, še to: če ti prikaže čudne znake, potem OCR softver ni pravilno nastavljen, ali pa je slika zelo slabe kakovosti. OCR zmoti vsaka packa, črta, zmečkanina papirja (ki pač postane temna lisa čez besedilo) … Skeniraj vsaj na 150 dpi (dots per inch), raje pa 300, potem pa izberi pravi jezik v katerem je besedilo na papirju, ko boš delala OCR. Mora delat. S kakšnim programom ala Photoshop se da sliko še dodatno obdelat, da se skrije packe in zmečkanine, ampak to ti ne morem tukaj razložit.