[greenstone_es] Re: Consulta Metadatos

  • From: Diego Spano <diegospano@xxxxxxxxx>
  • To: Lista (en español) Greenstone <greenstone_es@xxxxxxxxxxxxx>
  • Date: Wed, 11 Mar 2015 12:44:52 -0300

Mauro,

eso que pensaaste es totalmente posible. Hay un plugin que se llama
MetadataCSVPlugin que tenés que agregar a la colección. Ese plugin permite
importar los metadatos del documento leyendolos de un archivo csv.
El formato del archivo csv debe ser el siguiente:

la primera linea deben ser los nombres de los metadatos pero además, la
primera columna debe ser si o si "Filename". Luego en sucesivas filas, vas
agregando los valores. Por ejemplo, un csv basico quedaría asi:


Filename,Titulo,Autor,Tema
manual.pdf,Manual del Usuario,Diego Ruiz,Biologia
tesis1.pdf,Tesis sobre recursos naturales,Jorge Lopez,Recursos naturales
.....
....
....

Ese archivo .csv debes copiarlo en la carpeta import junto a los archivos
que mencionas en la columna 1.

Probalo y avisanos.






La primera linea es fija, e indica que el primer campo es el nombre del
archivo, el segundo es el titulo, el tercero el autor y asi....

Despues pones en la carpeta import de la colección al archivo csv junto con
los pdfs y corres el proceso de importacion.

Saludos!.

Diego


*Diego Spano* *Director de Proyectos, Prodigio Consultores*
Tel: (54 11) 5093-5313

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.prodigioconsultores.com%2F&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Contact me: [image: Skype] diegospano
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.linkedin.com%2Fin%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
[image: Follow teststamp on Twitter]
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.twitter.com%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>


2015-03-11 11:32 GMT-03:00 Mauro La Pietra <maurolapietra@xxxxxxxxxxx>:

> Buenos días a todos!
>
>
> Tengo una consulta sobre metadatos y asignación de los mismos. Tengo en mi
> cabeza la idea de lo que quiero hacer y no sé si es posible con el GLI del
> Greenstone.
>
> Originalmente mi intención era colocar metadatos directamente en los
> archivos pdf (usando un editor de pdf, por ejemplo), y que el Greenstone
> haga la extracción de los mismos al momento de subirlos. De esta forma, me
> aseguraba que los metadatos pertenezcan al archivo original, y luego
> utilizaba los metadatos tipo “.ex” para realizar las búsquedas. Como Diego
> Spano pudo revisar, hay un conflicto cuando el PDFBox está activo que
> impide la extracción del total de los metadatos por
> el “EmbeddedMetadataPlugin”. Como no se pudo solucionar este conflicto aún,
> tengo una nueva idea.
>
> Mi principal pregunta es si es posible generar otro archivo (además del
> pdf a subir) donde estén radicados los metadatos de ese archivo.
>
> Por ejemplo, existe la posibilidad de algo así como:
>
> Tener en el mismo directorio que el archivo “Norma RMS 5000.pdf”, otro
> archivo llamado “Norma RMS 5000.csv” (o cualquier otra clase de archivo),
> en el cual <<de alguna manera>> se indiquen los metadatos de forma tal que
> en dc.Título o en ex.Title (por ejemplo) se coloque la información que yo
> anteriormente había escrito en un archivo acompañante de cada archivo pdf
> que quiero subir.
>
> Busco hacer esto porque el Greenstone ahora lo manejo en forma local, y
> aún no lo tengo en el servidor como es el objetivo final. Mientras tanto,
> queriendo ganar tiempo, quiero ir incorporando metadatos, y me gusta la
> idea de tener los metadatos por fuera del programa GLI.
>
> Si alguien realizó algo así anteriormente, seguramente podrá darme una
> mano.
>
>
>
> De antemano muchísimas gracias!!
>
>
> Saludos a todos!!
>
>

Other related posts: