[greenstone_es] Re: PDFs y OCR en Greenstone

  • From: "felipe vera" <felipevera@xxxxxxxxx>
  • To: greenstone_es@xxxxxxxxxxxxx
  • Date: Fri, 26 Sep 2008 12:13:04 -0400

Si por favor Julian adjunta el collect.cfg y también ayudo a solucionar cuál
es el problema ya que en mi instalación al igual que Diego el pdf es
totalmente recuperable full text mediante Greenstone.


Saludos
Felipe Vera

El 26 de septiembre de 2008 3:58, Julian Moyano
<julianmoyanoc@xxxxxxxxx>escribió:

> Gracias a todos por la respuesta. os adjunto un PDF,  que proviene de
> imágenes digitalziadas y con OCR, en este ejemplo como en otros, Greenstone
> no busca en el documento, he llegado a pensar que puede influir las marcas
> de agua añadida. Saludos
>
> 2008/9/25 Diego Spano <diegospano@xxxxxxxxx>
>
> Hola Julian,
>>
>> el PDF que tiene las imagenes adentro, tiene alguna restriccion de
>> seguridad?. Si vos abris el pdf, podes seleccionar el texto o solo te
>> lo muestra como una imagen?. Como fue guardado el texto del OCR?
>>
>> Podes mandar un pdf de ejemplo?.
>>
>> Saludos
>>
>> Diego
>>
>> 2008/9/25 Julian Moyano <julianmoyanoc@xxxxxxxxx>:
>>  > Hola a todos. Me acaba de surgir una duda. Tengo varios documentos en
>> PDF,
>> > algunos han sido creados por documentos en Word u odt, y otros han
>> salido de
>> > la digitalización de documentos. En el primer caso Greenstone sí que
>> busca
>> > en el interior de los documentos, y recupera sus términos. En el
>> segundo,
>> > cuando los documentos provienen de imágenes digitalizadas y con
>> > reconocimiento OCR, los palabras de los documentos no son recuperadas
>> por el
>> > programa. ¿a qué se puede deber? Gracias
>>
>>
>


-- 
Saludos
Felipe Vera

Other related posts: