[greenstone_es] Consulta por Azcompact List GS2.86

  • From: lolguin@xxxxxxxxxxxxxxxxx
  • To: diegospano@xxxxxxxxx
  • Date: Wed, 6 Apr 2016 15:30:54 -0300 (ART)

Diego y Amig@s de la lista, buenas tardes.

Comento un poco mi tarea en GS 2.86  con los diarios del terremoto de 1944
y paso una consulta.

Segui el consejo de Diego y usé Abby12 para texto en pdf: trabaje los PDF
y quedaron "con texto de búsqueda". Todo OK,. Gracias!

Para darle un poco más de potencia, decidí armar una lista de palabras
para cada PDF trabajando con el txt que me genera ABBY. quedó muy bien!.
Tengo cientos de palabras por articulo (las que reconoce Abby y filtradas
por soft, comparadas con el diccionario de la RAE y una lista de
StopWord.).

El resultado de esta lista lo formatee como XML y lo inserté en el
"metadata.xml" de la colección, identificando cada palabra como un
Dc.Descriptor.

Quedó un XML de 35000 filas para una coleccion de 122 hojas del diario La
Nacion.

Lo vi desde GLI, los dc.descriptor se ven OK y la coleccion se arma muy bien.


Ahora la consulta:

Para visualizar los "Temas", puse AZCompactList.

Me despliega los grupos alfabeticos bien, pero ... cuando veo en detalle
una entrada, por ej "ABAJO" o "HABILITAR" noto que la lista del detalle SE
REPITE SIEMPRE TRES VECES, de manera que si la entrada figura en una sola
hoja del diario, me aparece 3 veces y ES LA MISMA HOJA. (si miro los link
que hace referencia, son hash distintos)

Esto es para todas las entradas!, no entiendo porqué sucede esto.

Si pueden darme una pista lo agradeceré.

Adjunto un par de imagenes para graficar el problema. :)

Saludos,
         ,.,
        MMMM_    ,..,
          "_ "__"MMMMM          ,...,,
   ,..., __." --"    ,.,     _-"MMMMMMM
  MMMMMM"___ "_._   MMM"_."" _ """"""
   """""    "" , \_.   "_. ."
          ,., _"__ \__./ ."
         MMMMM_"  "_    ./
          ''''      (    )
   ._______________.-'____"---._.
    \                          /
     \________________________/
     (_)                    (_)

Prog. Luis Alberto OLGUIN VILLAFÑE
 Instituto de Informática - UNSJ
  http://www.idei.unsj.edu.ar/portal


Attachment: Consulta_Olguin_1.png
Description: PNG image

Attachment: Consulta_Olguin_2.png
Description: PNG image

Other related posts:

  • » [greenstone_es] Consulta por Azcompact List GS2.86 - lolguin