[greenstone_es] RE: [greenstone_es] Error en indexación de datos

  • From: "abana.7" <abana.7@xxxxxxxxxxxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Mon, 28 May 2012 09:54:06 +0200

Yo tuve un problema parecido, aunque era sólo cuando la palabra empezaba por ñ, 
o á, é, í, ó, ú. Por ejemplo, "álbum" lo indexaba en la l. Pero en tu caso es 
extraño, porque lo primero que tienes es An, y supongo que no debería dar 
problemas. 

 

Al final, mi problema tenía que ver con la necesidad de que el clasificador 
procesara cualquier carácter Unicode que estuviera presente en los metadatos a 
clasificar. Lo arreglé haciendo dos cosas: añadiendo el archivo allkeys.txt en 
los archivos del sistema Greenstone, está explicado aquí:

http://wiki.greenstone.org/wiki/index.php/More_about_classifiers

 

y añadiendo en el remove suffix del clasificador esta expresión: 
[^abcdefghijklmnñopqrstuvwxyzáéíóú] (también añadí todo en mayúsculas para 
evitar problemas)

con lo que indicaba al clasificador que al indexar debía ignorar cualquier 
signo, a menos que fuera uno de los incluidos en esa expresión.

Así, al final conseguí que tuviera en cuenta cualquier letra y que ignorara 
signos que son frecuentes en la descripción de fondo antiguo (corchetes, etc.)

 

Esto no explica por qué no indexa correctamente el dato de tu colección, pero a 
lo mejor te sirve para hacer un arreglo.

 

¡Saludos!

Jorge Soret

 

 

________________________________

De: greenstone_es-bounce@xxxxxxxxxxxxx 
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de pedro muñoz
Enviado el: viernes, 25 de mayo de 2012 21:46
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Error en indexación de datos
Importancia: Alta

 

Estimados foristas.

Quisiera saber si alguien de la lista se ha encontrado con el siguiente 
problema: datos mal alfabetizados.

Les explico: Tengo una colección que tiene un listado de títulos de documentos, 
y me he fijado que algunos de ellos se encuentran incorrectamente 
alfabetizados, tal como muestra la figura más abajo. En la letra "N", del 
ejemplo, me ha alfabetizado el título "Anónimo : imágenes...", revisé el dato 
ingresado y está correcto. Alguien tiene idea a que se pueda deber.

Desde ya muchas gracias

Atte.

Pedro Muñoz

 

 

 

JPEG image

Other related posts:

  • » [greenstone_es] RE: [greenstone_es] Error en indexación de datos - abana.7