[greenstone_es] Re: DUDA

  • From: marcelo yornet <baryornet@xxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Fri, 8 Apr 2011 16:43:19 -0300

Disculpa Mariana: pero me permito disentir. 
El PDF ES un formato de archivo que puede encapsular otros tipos de archivo. 
Pero es un formato de archivo, de hecho el PDF/A es el formato de archivo 
recomendado por la ICA para conservación de documentos.
Que el greenstone aún no pueda trabajarlos como uno pretende no quiere decir no 
haya sido pensado para eso, para ser un formato de documento portable.
Lo que pasa es que el gran problema es que a Greenstone le falta una 
herramienta, quiza por la época en la que se pensó, para trabajar la estructura 
interna de los documentos. Un poco le pasa lo mismo a la archivologia con la 
descripción archivisticas, les cuesta trabajar la esctructura intena de los 
documentos digitales.
Hoy por hoy eso explota nos encontramos con colecciones de muchos documentos 
que a su vez tienen muchas paginas en muchas secciones.
El experimento con metadata-server.pl está muy bien pero sigue siendo 
insuficiente.

Por eso preguntaba: si genero un documento con pdfplug con el parametro 
-use_sections y -description-tags puedo despues agregarle tags <Section> a 
doc.xml y seguiría andando ¿no?

saludos

Marcelo

> Date: Fri, 8 Apr 2011 16:18:10 -0300
> Subject: [greenstone_es] Re: DUDA
> From: mariana@xxxxxxxxxxxxxxxxx
> To: greenstone_es@xxxxxxxxxxxxx
> 
> En los pdfs las secciones que se pueden generar es una sección por página
> usando el modificador -use_sections y -description_tags del plugin. No
> podés agregarle metadatos salvo los automáticos tipo Title....
> Hay que tener en cuenta que los PDFs no son un formato de archivo en sí
> mismos sino un encapsulador de formatos.....
> Lo mejor que podés hacer es tener el documento fuente en otro formato
> (html, docs), marcar las secciones ahí, y si querés después que te quede
> un pdf para la descarga lo guardás como pdf......
> No podés tratar de hacerle hacer al pdf algo para lo que no se pensó.....
> Suerte
> Mariana
> 
> >
> > Obviamente lo lógico seria usar el indice del PDF, pero no sé si lo hace.
> > Por eso te decía que uses la 2.84 que usa otro motor. Y es la ultima
> > versión estable de greenstone.
> > Podes consultar las opciones de pdfplug en la wiki de greenstone o por
> > lineas de comando usando:
> > perl -S pluginfo.pl PDFPlug
> >
> > saludos
> >
> > From: diana@xxxxxxxxxxxxxxxxxxxx
> > To: greenstone_es@xxxxxxxxxxxxx
> > Subject: [greenstone_es] Re: DUDA
> > Date: Fri, 8 Apr 2011 15:51:15 -0400
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > Yo creo que si debe haber algún plugin de pdf que sea capaz de
> > seccionarte el documento guiándose digamos por el índice, lo que si se es
> > que
> > el PDFPlug de 2.83 no lo hace a no ser que haya alguna configuración de la
> > que desconozca
> > si es asi por favor me ayudaría mucho, la verdad es que modificando el
> > doc.xml
> > es bastante tedioso y da lugar a muchos errores y eso sin contar que lo
> > que me
> > dijo Mariana de que a los pdf no se les pueden agregar secciones me tiene
> > dudando
> > y bastante preocupada, gracias por su interés y ayuda la verdad es que la
> > necesito. Saludos
> >
> >
> >
> >
> >
> >
> >
> > De:
> > greenstone_es-bounce@xxxxxxxxxxxxx
> > [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En
> > nombre de marcelo yornet
> >
> > Enviado el: viernes, 08 de abril de 2011 14:03
> >
> > Para: greenstone_es@xxxxxxxxxxxxx
> >
> > Asunto: [greenstone_es] Re: DUDA
> >
> >
> >
> >
> >
> >
> >
> > Yo
> > no tengo colecciones de PDF. No sé si agrupando las hojas en carpetas
> > dentro
> > del PDF el PDFPlug (que en la versión 2.84 cambio de motor, te convendría
> > usar
> > 2.84), el plugin reconocerá las secciones.
> >
> > De todas formas siempre se puede hacer secciones en un doc.xml editando el
> > xml
> > y metiendo secciones dentro de tag <SECTION>.
> >
> > En realidad no estoy seguro porque varias cosas cambiaron despues de las
> > 2.81.
> > Seguramente Mariana te sabrá confirmar esto.
> >
> >
> >
> >
> >
> >> From: diana@xxxxxxxxxxxxxxxxxxxx
> >
> >> To: greenstone_es@xxxxxxxxxxxxx
> >
> >> Subject: [greenstone_es] Re: DUDA
> >
> >> Date: Fri, 8 Apr 2011 14:24:16 -0400
> >
> >>
> >
> >> Mariana eso que me dices de que no se pueden agregar secciones a un
> >
> >> documento pdf, me preocupa pues todos los documentos que tengo para mi
> >
> >> futura colección son pdf y realmente el objetivo de hacer esta colección
> > es
> >
> >> dividirlos en secciones que por supuesto corresponderían a sus
> >> capítulos,
> >
> >> epígrafes ,subepigrafes, y asociarles a los epígrafes además del
> >> metadato
> >
> >> title, otro nuevo que yo lo llame subject que contiene un termino que
> >
> >> describe la tematica de la que trata esos epígrafes, por tanto un libro
> >
> >> trata de diferentes tematicas asociados a sus epígrafes, si por favor me
> >
> >> pudieran orientar con eso seria de mucha ayuda. muchas gracias saludos
> >
> >>
> >
> >> -----Mensaje original-----
> >
> >> De: greenstone_es-bounce@xxxxxxxxxxxxx
> >
> >> [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Mariana
> >> Pichinini
> >
> >> Enviado el: viernes, 08 de abril de 2011 12:51
> >
> >> Para: greenstone_es@xxxxxxxxxxxxx
> >
> >> Asunto: [greenstone_es] Re: DUDA
> >
> >>
> >
> >> No se pueden agregar secciones a un documento pdf. Es correcto como vos
> >
> >> hiciste editar el doc.xml (cuidando no alterar la codificación de
> >
> >> caracteres ni la estructura XML) en la carpeta ARCHIVES.
> >
> >> Luego tenés que regenerar la colección (buildcol.pl) sin volver a
> >
> >> importar, y reemplazar la carpeta index por building (todo esto se puede
> >
> >> realizar por la línea de comandos sin problemas). Si lo querés hacer por
> >
> >> la gli, la opción es como dijo Marcelo Reconstrucción mínima.
> >
> >> Mariana
> >
> >> >
> >
> >> > despues de modificar doc.xml deberías hacer de nuevo el proceso
> >
> >> > BuildCol.pl que creo que en el gli es Reconstrucción Mínima, pero
> > esto no
> >
> >> > estoy seguro.
> >
> >> > Es una forma muy comada de trabajar cuando tenés por ejemplo 5.000
> > pdf.
> >
> >> >
> >
> >> > From: diana@xxxxxxxxxxxxxxxxxxxx
> >
> >> > To: greenstone_es@xxxxxxxxxxxxx
> >
> >> > Subject: [greenstone_es] DUDA
> >
> >> > Date: Fri, 8 Apr 2011 11:07:45 -0400
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> >
> >
> >> > Hola estoy usando greenstone 2.83 y necesito saber como
> >
> >> > puedo dividir mis documentos (pdf) en secciones para asociarles un
> >
> >> > metadato a
> >
> >> > algunas de sus secciones, ya he activado y configurado las cadenas de
> >
> >> > formatos guiándome
> >
> >> > por la guía del programador y unos ejemplos que tengo, pero nada, ya
> > por
> >
> >> > ultimo
> >
> >> > modifique el doc.xml del documento donde esta la estructura del mismo
> > pero
> >
> >> > los
> >
> >> > cambios no se ven y ya no se que hacer, por favor si me pudieran
> > ayudar
> >
> >> > seria
> >
> >> > genial gracias saludos
> >
> >> >
> >
> >> >
> >
> >>
> >
> >>
> >
> >> Lic. Mariana Pichinini
> >
> >> Area Tecnologías
> >
> >> _______________________________________________
> >
> >> BIBHUMA - Biblioteca Profesor Guillermo Obiols
> >
> >> Facultad de Humanidades y Ciencias de la Educación
> >
> >> Universidad Nacional de La Plata
> >
> >> Calle 48 entre 6 y 7 - 1er subsuelo
> >
> >> B1900AMW LA PLATA, Argentina
> >
> >> Telefax: +54-221-4230125 interno 162 (líneas rotativas)
> >
> >> WEB: www.bibhuma.fahce.unlp.edu.ar
> >
> >>
> >
> >>
> >
> >>
> >
> >>
> >
> >>
> >
> >
> 
> 
> Lic. Mariana Pichinini
> Area Tecnologías
> _______________________________________________
> BIBHUMA - Biblioteca Profesor Guillermo Obiols
> Facultad de Humanidades y Ciencias de la Educación
> Universidad Nacional de La Plata
> Calle 48 entre 6 y 7 - 1er subsuelo
> B1900AMW LA PLATA, Argentina
> Telefax: +54-221-4230125 interno 162 (líneas rotativas)
> WEB: www.bibhuma.fahce.unlp.edu.ar
> 
> 
                                          

Other related posts: