[greenstone_es] Re: PDFs y OCR en Greenstone

Gracias a todos por la respuesta. os adjunto un PDF,  que proviene de
imágenes digitalziadas y con OCR, en este ejemplo como en otros, Greenstone
no busca en el documento, he llegado a pensar que puede influir las marcas
de agua añadida. Saludos

2008/9/25 Diego Spano <diegospano@xxxxxxxxx>

> Hola Julian,
>
> el PDF que tiene las imagenes adentro, tiene alguna restriccion de
> seguridad?. Si vos abris el pdf, podes seleccionar el texto o solo te
> lo muestra como una imagen?. Como fue guardado el texto del OCR?
>
> Podes mandar un pdf de ejemplo?.
>
> Saludos
>
> Diego
>
> 2008/9/25 Julian Moyano <julianmoyanoc@xxxxxxxxx>:
>  > Hola a todos. Me acaba de surgir una duda. Tengo varios documentos en
> PDF,
> > algunos han sido creados por documentos en Word u odt, y otros han salido
> de
> > la digitalización de documentos. En el primer caso Greenstone sí que
> busca
> > en el interior de los documentos, y recupera sus términos. En el segundo,
> > cuando los documentos provienen de imágenes digitalizadas y con
> > reconocimiento OCR, los palabras de los documentos no son recuperadas por
> el
> > programa. ¿a qué se puede deber? Gracias
>
>

Other related posts: