[greenstone_es] RE: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar términos distintos camp os

  • From: "Diego Spano" <dspano@xxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Thu, 11 Dec 2008 11:56:13 -0200

Después de ver el collect me surgen algunas dudas:

 

1.    Vos tenés un indice por todo esto:

 

arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
arch.FechaFinal,arch.FechaInicio

 

Es necesario indexar todos esos metadatos?. Alguien va a buscar alguna vez
por [NumPages]  o por el plugin con el que se importó el documento, o por el
valor del ancho y el alto de la miniatura?. Creo que podrias modificar el
indice por algo así:

 

arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion

 

Luego hacer otro indice por text y otro por arch.FechaFinal,arch.FechaInicio
y agregar por último un índice por allfields para hacer una búsqueda
general. Entonces el collect.cfg te quedaria asi:

 

Indexes
arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion
arch.FechaFinal,arch.FechaInicio

text

allfields

 

collectionmeta
arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion
arch.FechaFinal,arch.FechaInicio [l=es] “la descripción”

 

collectionmeta    .arch.FechaFinal,arch.FechaInicio [l=es] "año"

 

collectionmeta    .text [l=es] "texto completo"

 

collectionmeta    .allfields [l=es] "todos los campos"

 

 

2- Borrá todos los plugins que no necesites.

 

3- Dame un ejemplo de búsqueda que no funcione.

 

Saludos

 

Diego

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Julian Moyano
Enviado el: jueves, 11 de diciembre de 2008 11:32
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar
términos distintos campos

 

Gracias Diego por tu pronta respuesta. te adjunto el collect.cfg de mi
colección. Uso la versión 2.70 y Linux (Ubuntu) como SO, la búsqueda
avanzada la tengo activada por defecto pero desde la colección evito que se
pueda acceder por simplificar al usuario:
(http://www.manuelalbar.org/manuel/albar/memoria?site=localhost
<http://www.manuelalbar.org/manuel/albar/memoria?site=localhost&a=p&p=about&;
c=archivo&ct=1&qto=3&l=es&w=utf-8>
&a=p&p=about&c=archivo&ct=1&qto=3&l=es&w=utf-8)  Sigo trasteando pero no veo
luz...


#indexes    document:text document:Title document:Source
indexes
arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
arch.FechaFinal,arch.FechaInicio
levels        document
defaultindex
arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
defaultindex
defaultindex

plugin        ZIPPlug 
plugin        GAPlug 
plugin        TEXTPlug 
plugin        HTMLPlug -smart_block 
plugin        EMAILPlug 
plugin        PDFPlug 
plugin        RTFPlug 
plugin        WordPlug 
plugin        PSPlug 
plugin        ImagePlug 
plugin        ISISPlug 
plugin        NULPlug 
plugin        PagedImgPlug -default_language es -extract_keyphrases_kea4
-default_encoding utf8 -input_encoding auto -screenviewtype jpg
-extract_keyphrases -headerpage -thumbnail -thumbnailsize 100 -smart_block
-extract_historical_years -documenttype paged -extract_acronyms -process_exp
\.item$ -noscaleup -extract_email -screenviewsize 500 -block_exp
(?i)(\.jpe?g|\.gif|\.png|\.tif?f|\.te?xt|~)$ -minimumsize 100
-extract_language -screenview -markup_acronyms 
plugin        BibTexPlug 
plugin        BookPlug 
plugin        DSpacePlug 
plugin        ExcelPlug -convert_to auto 
plugin        IndexPlug 
plugin        FavouritesPlug 
plugin        FOXPlug 
plugin        HBPlug 
plugin        LaTeXPlug 
plugin        MACROPlug 
plugin        PPTPlug -convert_to auto 
plugin        MARCPlug 
plugin        OggVorbisPlug 
plugin        OAIPlug 
plugin        ReferPlug 
plugin        RogPlug 
plugin        StructuredHTMLPlug 
plugin        UnknownPlug 
plugin        W3ImgPlug 
plugin        MP3Plug 
plugin        ProCitePlug 
plugin        RealMediaPlug 
plugin        SRCPlug 
plugin        ArcPlug 
plugin        RecPlug -use_metadata_files 

format DateList "<td>[link][icon][/link]</td>
<td>[highlight]{Or}{[dls.Title],[dc.Title],[ex.Title],Untitled}[/highlight]<
/td>
<td>[ex.Date]</td>"

format HList "[link][highlight][ex.Title][/highlight][/link]"

format DocumentHeading "{Or}{[parent(Top):Title],[Title],untitled}<br>"

format DocumentText "[Text]"

format DocumentButtons "Detach|Highlight"

format VList "<td valign=\"top\">
<p></p>[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td>
<td valign=\"top\">
{If}{[ex.Source],<div align=\"justify\"><font
color=\"#333333\"><blockquote><strong><font size=\"2\">
[ex.srclink][arch.TipoDocumental][ex./srclink]</font></strong><br><p></p><bl
ockquote><em></em> <strong><font size=\"2\">Clasificación:</strong>
[arch.Seccion]:::::[arch.Subseccion]<p></p><strong>Productor / Procedencia:
</strong><em>[arch.Productor]</em><p></p><li><strong>Fecha: </strong>
[arch.FechaInicio]-[arch.FechaFinal] </li><strong>Lugar:
</strong>[arch.LugarProducc] <p></p><strong>Descripción:</strong>
[arch.Descripcion]</blockquote></i>}</font></div>"

collectionmeta    collectionname [l=es] "Archivo"
collectionmeta    iconcollection [l=es]
"_httpprefix_/collect/archivo/images/carchivo.jpg"
collectionmeta    iconcollectionsmall [l=es]
"_httpprefix_/collect/archivo/images/logo_archivo.jpg"
collectionmeta    .document:text [l=es] "text"
collectionmeta    .document:Title [l=es] "titles"
collectionmeta    .document:Source [l=es] "filenames"
collectionmeta    .document [l=es] "document"
collectionmeta    collectionextra [l=es] " ."
collectionmeta
.arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pr
oductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocument
al,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSiz
e,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Lang
uage,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL
,assocfilepath,hascover,srcicon,srclink,thumbicon,text [l=es] "la
descripción"
collectionmeta    .arch.FechaFinal,arch.FechaInicio [l=es] "año"

El 11 de diciembre de 2008 14:27, Diego Spano <dspano@xxxxxxxxxxxx>
escribió:

Julian,

 

Qué versión de GS estás usando y en que sistema operativo?. Podés pegar el
collect.cfg para verlo?. El problema se  produce cuando haces una búsqueda
con el formulario avanzado?.

 

Saludos

 

Diego

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Julian Moyano
Enviado el: jueves, 11 de diciembre de 2008 11:18
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Buscar términos distintos campos

 

Hola a todos. Tras crear la colección me he dado cuenta que al realizar una
búsqueda, Greenstone no busca como quiero. Si preguntamos por dos términos
de búsqueda y están cada uno en diferentes campos, no los recupera. Y solo
encuentra si están esos términos en el mismo campo. He modificado varias
veces los índices de búsqueda, e incluso los plug-in por si acaso, pero no
he encontrado la solución. ¿alguna idea?

Saludos 

www.manuelalbar.org

 

Other related posts:

  • » [greenstone_es] RE: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar términos distintos camp os - Diego Spano