[greenstone_es] Re: Consulta sobre PDFs y pasaje a HTML

Marcelo,

Greenstone genera la version html para mostrar desde los doc.xml. Lo que vos 
modificaste en la carpeta archives, no lo ves cuando consultás la colección 
porque no le volviste a correr el proceso build. 

Lo que vos podes hacer es lo siguiente, partir del htnml y asociar el pdf. 
Vamos con un ejemplo:

El escenario actual es que tenes un doc.pdf, lo importás en greenstone (usando 
el PDFplug) y cuando consultás ves una versión html generada automáticamente 
por GS que querrías que fuera diferente. De hecho, vos tenes el html que 
quiseras mostrar, correcto?.

Cual es el escenario propuesto?. En la carpeta import de la colección poné el 
html que vos tenés y llamalo igual que el documento pdf, por ejemplo: doc.html 
y doc.pdf. Configura el Htmlplugin para procesar los html y además para que te 
asocie el archivo pdf. De esta manera, cuando vos consultas en GS, vas a ver un 
html con el formato que querés (porque lo generaste vos) y además podés poner 
un link para ver/descargar el pdf asociado.

Espero haber sido de ayuda.

Saludos.

Diego
 
-----Mensaje original-----
De: greenstone_es-bounce@xxxxxxxxxxxxx 
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Marcelo Luda
Enviado el: jueves, 11 de diciembre de 2008 18:27
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Consulta sobre PDFs y pasaje a HTML

Estamos tratando de armar una colección de PDFs y queremos que se pueda
ver la par del archivo original una versión en html.
Sabemos que:
*El greenstone genera su propio html conviertiéndolo con pdftohtml
*Si tengo una colección de htmls con "anclas" (anchors) definidos el
greenstone me divide la página en capítulos, lo que queda muy
presentable

Mi intención es combinar estas dos cosas tratando que a los pdfs se le
asocie un html que yo genero por mi cuenta al greenstone (y no el que
este genera automátiacmente). Lo que quiero saber es si alguien intentó
hacer algo similar o si saben donde guarda el greenstone el html que
genera de forma automática.

Se que en el archivo archives/HASH????.dir/doc.xml (donde están los
metadatos) se guarda parte del html generado, pero el que se muestra en
la web no sale de ahí (ya probé de modificarlo y los cambios no se
reflejan en la página).

desde ya, muchas gracias


-- 
Marcelo A. Luda
Sistemas - Biblioteca "Luis F. Leloir"
Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires



Other related posts: