[greenstone_es] Re: Consulta de secciones

  • From: Diego Spano <diegospano@xxxxxxxxx>
  • To: greenstone_es@xxxxxxxxxxxxx
  • Date: Thu, 8 Jul 2010 11:13:06 -0300

Eugenia,

para lograr la division en secciones de un documento, tenés que hacer
distinto.

1- Exportas el pdf como html
2- Editás el html agregandole los códigos de inicio y fin de seccion
3- Importas los html en Greenstone con el argumento associate_ext pdf, es
decir, el documento en html arrastra al documento en PDF. Lo que se indexa
no es el pdf sino el html que vos dividiste en secciones. Por lo tanto el
PDFPlugin no lo necesitas.

Ahora bien, para poder dividir un html en secciones tenés que hacer lo
siguiente. Esa división del documento en secciones como lo ves en la
colección de demo se hace a traves de las etiquetas de descripción. Las
etiquetas de descripción reconocidas por HTMLPlugin se insertan en el texto
fuente HTML de los documentos para definir el lugar en el que las
secciones empiezan y terminan y para especificar los títulos de sección. Se
ven de la siguiente manera:

 <!--
 <Section>
 <Description>
 <Metadata name="Title">Titulo de la seccion </Metadata>
 </Description>
 -->

 (el texto de la sección va aquí)

 <!--
 </Section> (este tag se usa para cerrar la sección)
 -->

Tené en cuenta que las secciones pueden anidarse, es decir, dentro de una
seccion, pueden abrirse otras, por ejemplo para representar esta estructura:

Libro AAAAAA (abro la seccion principal)
-----> Prologo (abro y cierro seccion)
-----> Cap. 1 (abro esta seccion)
----------> Tema 1 (abro y cierro seccion)
----------> Tema 2 (abro y cierro seccion)
-----> (cierro seccion Cap. 1)
-----> Cap. 2  (abro esta seccion)
----------> Tema 3 (abro y cierro seccion)
----------> Tema 4 (abro y cierro seccion)
-----> (cierro seccion Cap. 2)
(cierro seccion principal)

Fijate en la coleccion de demo, anda a la carpeta
c:\greenstone\collect\demo\import y ahi adentro editá cualquiera de los html
que hay. Vas a ver esa division en secciones y te vas a darcuenta como
hicieron cada documento.


Saludos!.

Diego

Diego Spano
Prodigio Consultores
Bernardo de Irigoyen N° 1114 2°B
Capital Federal - Argentina
Tel: (54 11) 5093-5313
www.prodigioconsultores.com


2010/7/1 Eugenia <eugenia.reynolds@xxxxxxxxx>

> Hola, recién estoy empezando a usar el Greenstone para crear una biblioteca
> digital para material en formato pdf. Mi consulta es la siguiente.
> En la carpeta import se encuentran los archivos pdf con sus
> correspondientes archivos de metadatos. Una vez que seleccioné los índices y
> los clasificadores, y modifiqué los plugins PDFPlugin (con el argumento
> -convert_to html) y HTMLPlugin con el argumento -description_tags
> -associate_ext pdf), creé la colección.
> El asunto es que en la página de navegación donde se muestra el contenido
> del archivo, ademas de la posibilidad de descargar el archivo pdf, necesito
> que me muestre el contenido del archivo extraído a html y que lo separe por
> secciones y me muestre el índice de contenido, tal como aparece en la
> colección de demostración del Greenstone.
> Como consigo hacer esto?
>
> Por si lo necesitan, adjunto el archivo collect.cfg
>
> Desde ya, gracias
>
> --
> Saludos!
> Eugenia
>

Other related posts: