[slikom] Re: Rad sa otvorenim skenerom

  • From: Robert Jelic <robertjelic8@xxxxxxxxx>
  • To: slikom@xxxxxxxxxxxxx
  • Date: Tue, 5 Nov 2013 09:39:33 +0100

Pozdrav svima!
Evo da i ja kazem nekoliko rijeci o mojim iskustvima u vezi skeniranja.
Skeniram knjige vec vise od 10 godina.
Prvo sam imao, (a to je skoro 10 godina), Canon N670U skener. To je
lijepi i tanki skener.
Kada sam prije otprilike godinu i po prešaosa XP na sedmicu, naravno
morao sam i kupiti novi skener. Canon je prestao nuditi podršku za
stare skenere.
I tako sam dao oko 250 EURO i kupio opet Canon skener. To je ovog puta
CanoScan 9000f. To je u stvari plošni skener za skeniranje filma.
On ima takozvani CCD senzor. To su prema onome što sam procitao na
webu, kvalitetniji senzori.
Ali ono sto me privuklo najvise za njega je brzina skeniranja.
Skenirajuci iz programa FineReader u automatskom nacinu, na 600 dpi, u
skali sivih tonova, za jedan sat mogu napraviti oko 180 stranica
knjige, a u color nacinu skeniranja mogu napraviti oko 150 stranica
knjige sa rezolucijom od 600 dpi.
Naravno da radim sa podignutim poklopcem obavezno u mraku. Naime, ako
vam sa strane ispod dolazi svijetlo, skenirana slika ce biti nejasnija
i FineReader ce tesko prepoznati znakove.
Isto tako, obavezno podesim velicinu polja koji se skenira. To je
obavezno prema velicini stranice koju skeniram. Ako je velicina
stranice 17X25 cm, (to je manje od velicine A4 formata), odredim da je
i velicina polja koji se skenira 17X25 cm.
Prema tome, po mojim iskustvima, slobodno se moze skenirati sa
otvorenim poklopcem, ali u mraku kako bi se izbjeglo da ispod stakla
na rubovima knjige dopire svijetlo.
Sto se tice kvalitete OCR prepoznavanja, da ne ponavljam ono sto je
bilo vec receno, mogu samo to reci da niti jedan stroj, niti jedan
program nije savrsen. Kvaliteta ovisi i o kvaliteti slova u crnom
tisku. Ako je los kontrast u crnom tisku, ako je stara knjiga i sl.,
onda ce i kvaliteta prepoznavanja biti losija.
Meni se cesto dogodi da rijeci kao na primjer: ili prepozna kao iii,
medju kao medu, ce, sto, prepoznaje bez kvacica  i sl. Ja to rijesavam
tako da uvijek tekst spremam u word. Kada citam, i naidjem na takve
rijeci, onda ih ispravljam opcijom Replace All (Zamjeni sve).
E da, oni koji nesto vide, mogu knjige digitalizirati i pomocu
fotoaparata. Ja sam, dok sam jos bio bolje vidio, to isprobavao i bio
sam poprilicno zadovoljan. Jednostavno na podlogu stavite knjigu;
osvjetlite ju pomocu nekog izvora svjetla tako da svjetlo bude sto je
vise moguce ravnomjerno rasporedjeno po stranici knjige; fotoaparat
postavite na odredjenoj udaljenosti tako da stranica knjige bude
vidljiva u cijelosti na zaslonu fotoaparata, najbolje je da na neki
nacin fotoaparat pricvrstite za neki nosac kako nebi dolazilo do
pomicanja prilikom slikanja; jednom rukom pridrzavate stranicu knjige
koju slikate da ona bude sto je vise moguce u ravnini s podlogom,
(mislim na to da dio stranice u sredini knjige koji se savija bude sto
je vise moguce ravan sa podlogom), naravno pazite na to da rukom ne
prekrijete tekst pa ruku drzite uz rubove knjige; a drugom rukom
pritisnete dugme za slikanje na fotoaparatu. Kada je gotovo, okrenete
novu stranicu i postupak ponovite.
Osim toga, mozete, a to je bolje, odabrati opciju sa odgodjenim
slikanjem. Na primjer: Nakon sto ste  okrenuli novu stranicu,
pritisnete dugme na fotoaparatu i on za npr. 5 sekundi uslika
stranicu. Za tih 5 sekundi vi mozete s obje ruke drzati knjigu tako da
stranice knjige budu sto ravnije sa podlogom.
Ja sam to radio sa fotoaparatom od 12 i 14 megapiksela. Kvaliteta je
bila podjednaka slici koju sam napravio sa skenerom, ali za manje
vremena. Naravno, vise megapiksela i bolje osvjetljenje daju
kvalitetniju sliku. Kvalitetnija slika daje i bolju OCR obradu.
Srdacan pozdrav!
Robert Jelic

Dana 5.11.2013., kontakt Gradimir Kragic <bastono@xxxxxxxxx> je napisao:
>
>
>     Zdravo svima,
>
> skener uvijek skenira punu površinu, A4, ako nije drugačije definisano.
> Hoće li slobodna površina biti u mraku ili osvjetljena prirodnom svjetlošću
>
> manje je bitno. Ako je osvjetljena skenirani pikseli će imati jednu
> vrijednost a ako nije osvjetljena, onda će skenirani pikseli imati drugu
> vrijednost. Ipak, nije baš nebitno da li je osvjetljeno ili nije.
> Najvažnije je da skenirani tekst leži na staklu te da ispod skeniranog
> teksta ne ulazi druga svjetlost.. Da podsjetim, skener na sebi ima lampu
> koja svjetli i osvjetljava tekst, tamo gdje su slova, gdje je nešto crno
> ili u drugoj boji je drugačiji elektricitet u odnosu na bijele površine.
> prepoznavanjem tog elektriciteta skener prepoznaje sliku koju skenira i
> takvu sliku prosljeđuje softveru koji dalje obrađuje i vrši prepoznavanje
> karaktera koji su slova, interpunkcija kao i formata tih karaktera kao što
> je veličina fonta, tip fonta i slično. Najbolje je dakle za skener da mu
> ispod skeniranog teksta ne ulazi druga svjetlost. Kada se skenira samo
> jedan list papira, onda je praktično i preporučljivo da se skener poklopi.
> Drugačije to najčešće nije moguće.
>     Treba voditi i o jačini osvjetljenja same lampe, u programu najčešće
> postoji opcija za to podešavanje pa ako je podešeno na automatsko, onda
> dodatna svjetlost može da utiče na jačinu osvjetljenja. Inače, kao što
> znate, prepoznavanje teksta se može raditi ne samo pomoću skenera već i
> pomoću kamere ili slika urađenih foto aparatom. U ova dva druga slučaja je
> opet vrlo bitno da je tekst dobro osvjetljen. Ja sam lično skoro propuštao
> jedan tekst kroz Fine Reader koji nije skeniran već slikan i prepoznavanje
> je bilo vrlo dobro jer su i slike teksta bila više nego odlične. Za moj
> zaključak napisaću da je kod skeniranja bitno da je što manje dodatne
> svjetlosti.
>
>     Pozdrav, Gradimir
>
>
>
>
>                     __________
>
> Podaci o listi:
>
> 1. Web strana: http://www.slikom.info/ml/sl.html
> 2. Adresa za prijavu: slikom-request@xxxxxxxxxxxxx u subjektu upisati:
> subscribe
> 3. Adresa za odjavu: slikom-request@xxxxxxxxxxxxx u subjektu upisati:
> unsubscribe
> 4. RSS/feed: http://www.slikom.info/feed.xml
> 5. Podcast: http://www.audio.slikom.info/feed.xml
> 6. Adresa moderatora: SliKom-Moderators@xxxxxxxxxxxxx
>
>                     __________
>
>
>
>


                    __________

Podaci o listi:

1. Web strana: http://www.slikom.info/ml/sl.html
2. Adresa za prijavu: slikom-request@xxxxxxxxxxxxx u subjektu upisati: subscribe
3. Adresa za odjavu: slikom-request@xxxxxxxxxxxxx u subjektu upisati: 
unsubscribe
4. RSS/feed: http://www.slikom.info/feed.xml
5. Podcast: http://www.audio.slikom.info/feed.xml
6. Adresa moderatora: SliKom-Moderators@xxxxxxxxxxxxx

                    __________



Other related posts: