[greenstone_es] Re: Enlaces estables

  • From: Ricardo Cossalter <rcossalter@xxxxxxxxxxx>
  • To: greenstone es <greenstone_es@xxxxxxxxxxxxx>
  • Date: Wed, 2 Feb 2022 14:58:44 +0000

Hola Mariana.
Estoy trabajando con Greenstone 3. En dc.Identifier tengo el nombre del PDF sin 
la extensión (y es único). Corro los scripts desde la consola.
Voy a volver a probar lo que me decís (explicitar el OIDmetadata) o las otras 
alternativas. Después te cuento.
Gracias!

________________________________
De: greenstone_es-bounce@xxxxxxxxxxxxx <greenstone_es-bounce@xxxxxxxxxxxxx> en 
nombre de Mariana Pichinini <mariana@xxxxxxxxxxxxxxxxx>
Enviado: miércoles, 2 de febrero de 2022 10:31
Para: greenstone es <greenstone_es@xxxxxxxxxxxxx>
Asunto: [greenstone_es] Re: Enlaces estables

Hola Ricardo cómo estás? Creo que estás trabajando con la versión 2 de gsdl, no?

Sí, para generar enlaces estables a los PDFs que no cambien si se reindexa toda 
la colección, podés usar al menos dos alternativas:
perl -S import.pl -OIDtype assigned -OIDmetadata dc.Identifier -site localsite 
<nombre-col>

Está alternativa hay que correrla así por consola o configurarla en el archivo 
de configuración de la colección para que quede por defecto y no haya que 
ponerla cada vez.....
Para que está opción funcione, siempre hay que indicar cuál es el metadato del 
cuál va a tomar el identificador del documento (no funciona por defecto, hay 
que poner el nombre del metadato que vas a usar, este metadato no puede tener 
valores repetidos y tiene que haber sido cargado en los metadatos del 
documento, por ejemplo, tiene que haber un metadato que diga <Metadata 
name="dc.Identifier">M2345</Metadata> asociado a un documento x.

La otra alternativa es almacenar cada documento en una carpeta con un nombre x, 
por ej., carpeta M2345, y luego usar -OIDtype dirname, va a tomar el nombre 
para la URL del documento de ahí.

Una tercera sería poner en el nombre del archivo a incluir en la colección el 
nombre que quiero que tenga, por ej., M2345.pdf, y usar la opción en el import 
-OIDtype fullname, pero aquí hay que tener mucho cuidado con como se nombran 
los archivos (en los otros casos también, je) ya que no puede haber espacios en 
blanco, caracteres raros, ni repeticiones de nombres....

Con alguna de estas opciones, el OAI debiera levantar los registros 
correctamente...
Suerte!!!


________________________________
De: "Ricardo Cossalter" <rcossalter@xxxxxxxxxxx>
Para: "greenstone es" <greenstone_es@xxxxxxxxxxxxx>
Enviados: Martes, 1 de Febrero 2022 18:45:48
Asunto: [greenstone_es] Re: Enlaces estables

Ampliación de mi mail anterior:

Probé haciendo lo siguiente:
perl -S import.pl -OIDtype assigned -site localsite <nombre-col>
por default OIDmetadata es dc.Identifier
en dc.Identifier cargué el nombre del archivo PDF (en metadata.xml)
perl -S buildcol -site localsite <nombre-col>

El enlace al documento queda tipo ...index/assoc/<Identif>/doc.pdf. Identif es 
parte del nombre del archivo. La interfaz pública se ve normal, pero cuando 
consulto el oaiserver para esa colección, no muestra los metadatos. Solo veo el 
OAI Record Header. Cuando importo con el OIDtype default (hash), sí muestra los 
metadatos.

Mi intención es tener un enlace único al documento, que no cambie con cada 
reconstrucción de la colección. Tampoco estoy seguro de que lo anterior sea 
necesario.

Si alguien me lo puede aclarar, lo agradeceré.

Saludos,

Ricardo Cossalter
Biblioteca INTI

________________________________
De: greenstone_es-bounce@xxxxxxxxxxxxx <greenstone_es-bounce@xxxxxxxxxxxxx> en 
nombre de Ricardo Cossalter <rcossalter@xxxxxxxxxxx>
Enviado: martes, 1 de febrero de 2022 12:18
Para: Lista (en español) Greenstone <greenstone_es@xxxxxxxxxxxxx>
Asunto: [greenstone_es] Enlaces estables

Hola Diego y lista,
tengo una colección de PDFs construida en GS3. Quería saber acerca de la 
estabilidad de los enlaces al documento (Resource Identifier tipo 
...index/assoc/HASH01d7.dir/doc.pdf). ¿Cómo hacer para que estos enlaces sean 
estables? Leí sobre OIDtype y hash_on_ga_xml o assigned y OIDmetadata, pero no 
me queda claro. ¿Me podrían aclarar un poco?
Gracias y Saludos,

Ricardo Cossalter
Biblioteca INTI


--
Lic. Mariana Pichinini
Area Tecnologías
_______________________________________________
BIBHUMA Biblioteca Prof. Guillermo Obiols
Facultad de Humanidades y Ciencias de la Educación
Universidad Nacional de La Plata
Calle 51 entre 124 y 125 - Edificio B
ENSENADA (1925), Argentina
Telefax: +54-221-4236671/73/75 interno 1259
WEB: http://www.bibhuma.fahce.unlp.edu.ar
RI: http://www.memoria.fahce.unlp.edu.ar
CNG: http://cng.fahce.unlp.edu.ar

Other related posts: