[greenstone_es] Re: Inconvenientes con GLI

  • From: Diego Spano <diegospano@xxxxxxxxx>
  • To: greenstone_es@xxxxxxxxxxxxx
  • Date: Tue, 17 Nov 2009 12:30:40 -0300

Fiorella,

para procesar ese tipo de pdfs que están protegidos (y asumiendo que no
tenés la clave para desprotegerlos), podés configurar el PDFplugin con la
opción -convert_to jpg. ASi, en vez de una version html, tenés una versión
en imagenes.

Simplemente agregá otro PDFplugin y ubicalo debajo del PDFPlugin que ya
tenés configurado. Cuando crees la coleccion, el archivo pdf que queres
importar va a ser rechazado por el primer PDFPlugin porque no puede
extraerle el texto, entonces intentará con el segundo, y como ese está
configurado para que no extraiga texto sino simplemente genere una imagen
por cada página, entonces el documento va a ser agregado a la colección.

En cuanto a la carpeta assoc. Ese es un problema del gli. Cuando creas la
colección GLI te genera los indices en la carpeta building y una vez que
termina el proceso mueve todo lo que está dentro de building a la carpeta
index, para que de esta manera pueda consultarse la coleccion.

Por algún motivo, ese proceso puede quedar mal finalizado, y es ahi donde
tenés parte de la coleccion en building y parte en index. Entonces es cuando
tenes que finalizarlo manualmente, moviendo lo que haya quedado en building
a la carpeta index.

En cuanto a la página de búsqueda, fijate en la query.dm.

Saludos

Diego



2009/11/17 fiorella torres <fiorella_3247@xxxxxxxxxxx>

>  Hola Diego...
> Naguara... Otra vez me has ayudado...
> Muchas Gracias...
> De verdad que ni idea que los archivos.pdf estuvieran bloqueados...
> Revise las propiedades de los documentos y todos dicen:
> "Todo el contenido del documento esta codificado y los motores de búsqueda
> no pueden acceden a los metadatos de este documento"
> Pero sabes... tuve que copiar la carpeta que se creo en *Archive* y
> pegarla en la carpeta
> *Assoc*... Este problema se me presento anteriormente y Julian me dijo que
> verificará si el contenido
> de esas dos carpetas eran las mismas... Pero no se porque no genera los
> archivos directamente en la
> carpeta de "Assoc".
>
> Y queria preguntarte otra cosita sino es mucha molestia...
>
> Que archivo .dm modifica la sección de "Página de Búsqueda" de las
> colecciones?¿
> Revise el archivo browse.dm, docs.dm,base.dm ... y nada...
> Utilice el archivo document.dm para modificar las pagina de titulo,fuente,
> autor y asignatura.
> Y el archivo about.dm para modificar la página principal de las
> colecciones... Como me dijistes....
>
> Muchas Gracias por todo Diego... Full agradecida por regalarme tu tiempo...
>
>
> Besitos y Full Éxito
>
>
>
>
> *.....:::::: *ღ * *ғιorella ™  ღ *:::::.....*
>
>
>
>
>
>
> ------------------------------
> From: diegospano@xxxxxxxxx
> Date: Tue, 17 Nov 2009 11:20:49 -0300
>
> Subject: [greenstone_es] Re: Inconvenientes con GLI
> To: greenstone_es@xxxxxxxxxxxxx
>
> Fiorella, quizas el problema está en que el pdf tiene alguna restricción,
> es decir, que esté protegido. Abrilo con el Acrobat Reader y fijate en las
> propiedades del documento. Si tiene limitada la extracción de contenido
> entonces el plugin no podrá procesarlo.
>
> Saludos
>
> Diego
>
>
> 2009/11/16 fiorella torres <fiorella_3247@xxxxxxxxxxx>
>
>
> Buenas Tardes Compañeros.
>
> La razón de mi correo es para que por favor me ayuden tantito...
> Estoy creando una carpeta llamada "Redes" dentro de una colección llamada
> "Informática"
> A dicha carpeta (Redes) le agrego 2 archivos .pdf... y los asigno los
> metadatos...
> Pero resulta que reviso la colección desde mi navegador y no carga esa
> carpeta a la que hago mención...
> De hecho tengo dos metadatos (Asignatura y Autor) y cuando busco por esos
> metadatos no aparecen...
> Es como si la carpeta no existiera...
> Yo revise las carpetas de C:\Greenstone\collect\informat\archives y
> C:\Greenstone\collect\informat\index\assoc
> Como me dijo mi compañero Julián ... por otro problemita que tuve
> anteriormente...
> Y allí tampoco aparece nada referente a la carpeta de Redes... pero en la
> carpeta de C:\Greenstone\collect\informat\import
> si aparece... =X
> Es como si no creara los archivos necesarios para que se cargen ...
>
> Entre los mensajes que se imprimen al crear la colección de Informática,
> luego de agregar la carpeta de redes esta:
> "ADVIRTIENDO: Ningún plugin podrá ser procesado
> Redes\antenas_caseras_receptoras_de_wifi.pdf " pero no comprendo porque
> si me ubico en la sección de Diseño y esta el pluggins de PDFPlug
>
> Algún compañero que me ayude al respecto... le estaré agredecido de
> antemano...
>
> Gracias y Full Éxito
> **
>
>
>
> *.....:::::: *ღ * *ғιorella ™  ღ *:::::.....*
>
>
>
>
>
> ------------------------------
> Date una vuelta por Sietes y conoce el pueblo de los expertos en Windows 
> 7<http://www.sietesunpueblodeexpertos.com/>
>
>
>
> ------------------------------
> Date una vuelta por Sietes y conoce el pueblo de los expertos en Windows 
> 7<http://www.sietesunpueblodeexpertos.com/>
>

Other related posts: