[greenstone_es] Incorporación de nuevos archivos a una colección

  • From: Nicolás Rucks <nrucks@xxxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Fri, 31 Jul 2009 13:04:27 -0300

Hola gente,
estoy usando Greenstone (o aprendiendo a usarlo) desde hace unos meses 
solamente.
Trabajo con la versión 2.81, sobre Linux , generalmente directamente desde la 
consola de Linux (uso los comandos import.pl , buildcol.pl y modifico el 
archivo collect.cfg del directorio /etc/ de mi colección).

Mi problemática es acerca de la incorporación de nuevos archivos a una 
colección (estoy trabajando con fotos, *.jpg y *.tif).

Les cuento lo que hago/trato de hacer:

Tengo ya una determinada cantidad de archivos .jpg en la colección (se hicieron 
los import.pl y buildcol.pl correspondientes)
Los archivos de las fotografías quedan pues en las carpetas /archives/ y en 
/index/assoc/
-posteriormente elimino los archivos de la carpeta /archives/ (aquellos que han 
sido generados por import.pl)

Para un segundo grupo de archivos, vuelvo a ejecutar import.pl 
Ahora /archives/ solo tiene los archivos nuevos,

y 

buildcol.pl -keepold -builddir /var/www/gsdl/collect/fotos/index fotos
es decir, que pretendo no generar un nuevo INDEX , sino sumar los archivos 
nuevos y sus metadatos, directamente sobre el INDEX ya existente.

En /index/assoc/ están tanto los archivos viejos como los nuevos.


Ahora el sitio "actualizado" de mi colección Greenstone funciona: desde el 
botón de "FUENTE" se pueden ver los archivos nuevos y los viejos, 
PERO sus metadatos están mezclados,
Y las búsquedas me recuperan documentos errados
Y las listas de metadatos solo me muestran los datos NUEVOS, no los VIEJOS.
Como si el parámetro "-keepold" de buildcol hubiera mantenido los archivos 
antiguos, pero no hubiera tenido en cuenta los metadatos de los archivos ya 
existentes.
En resumen: se mezclaron las cosas.

Evidentemente estoy haciendo algo mal.

La pregunta es pues:
CÓMO SE PUEDE HACER PARA INCORPORAR UNA NUEVA CANTIDAD DE ARCHIVOS A LA 
COLECCIÓN, SIN QUE "IGNORE" LOS ARCHIVOS ANTERIORES QUE YA ESTÁN EN 
/index/assoc/ PERO YA NO ESTÁN EN /archives/

O acaso es indispensable tener los archivos DUPLICADOS entre /archives/ e 
/index/assoc/
y generar todo de vuelta?


Espero haber planteado claramente el problema,
y que Greenstone tenga un parámetro fácil de modificar para lograr esto.

Desde ya, muchas gracias!
Atentamente,
Nicolas Rucks,
Buenos Aires, Argentina.

Other related posts:

  • » [greenstone_es] Incorporación de nuevos archivos a una colección - Nicolás Rucks