[greenstone_es] Re: PDFs y OCR en Greenstone

Julian,
 
GS procesa al pdf que enviaste sin ningun tipo de problema!!!. Te adjunto
una imagen para que veas. Hice búsquedas y funciona OK. Decime como está
armado tu collect.cfg.
 
Saludos

Diego

  _____  

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Julian Moyano
Enviado el: viernes, 26 de septiembre de 2008 4:58
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: PDFs y OCR en Greenstone


Gracias a todos por la respuesta. os adjunto un PDF,  que proviene de
imágenes digitalziadas y con OCR, en este ejemplo como en otros, Greenstone
no busca en el documento, he llegado a pensar que puede influir las marcas
de agua añadida. Saludos


2008/9/25 Diego Spano <diegospano@xxxxxxxxx>


Hola Julian,

el PDF que tiene las imagenes adentro, tiene alguna restriccion de
seguridad?. Si vos abris el pdf, podes seleccionar el texto o solo te
lo muestra como una imagen?. Como fue guardado el texto del OCR?

Podes mandar un pdf de ejemplo?.

Saludos

Diego

2008/9/25 Julian Moyano <julianmoyanoc@xxxxxxxxx>:

> Hola a todos. Me acaba de surgir una duda. Tengo varios documentos en PDF,
> algunos han sido creados por documentos en Word u odt, y otros han salido
de
> la digitalización de documentos. En el primer caso Greenstone sí que busca
> en el interior de los documentos, y recupera sus términos. En el segundo,
> cuando los documentos provienen de imágenes digitalizadas y con
> reconocimiento OCR, los palabras de los documentos no son recuperadas por
el
> programa. ¿a qué se puede deber? Gracias




Attachment: huesca.JPG
Description: JPEG image

Other related posts: