[greenstone_es] RE: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar términos distintos camp os
- From: "Diego Spano" <dspano@xxxxxxxxxxxx>
- To: <greenstone_es@xxxxxxxxxxxxx>
- Date: Thu, 11 Dec 2008 11:56:13 -0200
Después de ver el collect me surgen algunas dudas:
1. Vos tenés un indice por todo esto:
arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
arch.FechaFinal,arch.FechaInicio
Es necesario indexar todos esos metadatos?. Alguien va a buscar alguna vez
por [NumPages] o por el plugin con el que se importó el documento, o por el
valor del ancho y el alto de la miniatura?. Creo que podrias modificar el
indice por algo así:
arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion
Luego hacer otro indice por text y otro por arch.FechaFinal,arch.FechaInicio
y agregar por último un índice por allfields para hacer una búsqueda
general. Entonces el collect.cfg te quedaria asi:
Indexes
arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion
arch.FechaFinal,arch.FechaInicio
text
allfields
collectionmeta
arch.Descripcion,arch.LugarProducc,arch.Productor,arch.Seccion,arch.Serie,ar
ch.Subseccion,arch.Tipo2,arch.TipoDocumental,arch.Unidaddesubseccion
arch.FechaFinal,arch.FechaInicio [l=es] la descripción
collectionmeta .arch.FechaFinal,arch.FechaInicio [l=es] "año"
collectionmeta .text [l=es] "texto completo"
collectionmeta .allfields [l=es] "todos los campos"
2- Borrá todos los plugins que no necesites.
3- Dame un ejemplo de búsqueda que no funcione.
Saludos
Diego
De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Julian Moyano
Enviado el: jueves, 11 de diciembre de 2008 11:32
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar
términos distintos campos
Gracias Diego por tu pronta respuesta. te adjunto el collect.cfg de mi
colección. Uso la versión 2.70 y Linux (Ubuntu) como SO, la búsqueda
avanzada la tengo activada por defecto pero desde la colección evito que se
pueda acceder por simplificar al usuario:
(http://www.manuelalbar.org/manuel/albar/memoria?site=localhost
<http://www.manuelalbar.org/manuel/albar/memoria?site=localhost&a=p&p=about&
c=archivo&ct=1&qto=3&l=es&w=utf-8>
&a=p&p=about&c=archivo&ct=1&qto=3&l=es&w=utf-8) Sigo trasteando pero no veo
luz...
#indexes document:text document:Title document:Source
indexes
arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
arch.FechaFinal,arch.FechaInicio
levels document
defaultindex
arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pro
ductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocumenta
l,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSize
,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Langu
age,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL,
assocfilepath,hascover,srcicon,srclink,thumbicon,text
defaultindex
defaultindex
plugin ZIPPlug
plugin GAPlug
plugin TEXTPlug
plugin HTMLPlug -smart_block
plugin EMAILPlug
plugin PDFPlug
plugin RTFPlug
plugin WordPlug
plugin PSPlug
plugin ImagePlug
plugin ISISPlug
plugin NULPlug
plugin PagedImgPlug -default_language es -extract_keyphrases_kea4
-default_encoding utf8 -input_encoding auto -screenviewtype jpg
-extract_keyphrases -headerpage -thumbnail -thumbnailsize 100 -smart_block
-extract_historical_years -documenttype paged -extract_acronyms -process_exp
\.item$ -noscaleup -extract_email -screenviewsize 500 -block_exp
(?i)(\.jpe?g|\.gif|\.png|\.tif?f|\.te?xt|~)$ -minimumsize 100
-extract_language -screenview -markup_acronyms
plugin BibTexPlug
plugin BookPlug
plugin DSpacePlug
plugin ExcelPlug -convert_to auto
plugin IndexPlug
plugin FavouritesPlug
plugin FOXPlug
plugin HBPlug
plugin LaTeXPlug
plugin MACROPlug
plugin PPTPlug -convert_to auto
plugin MARCPlug
plugin OggVorbisPlug
plugin OAIPlug
plugin ReferPlug
plugin RogPlug
plugin StructuredHTMLPlug
plugin UnknownPlug
plugin W3ImgPlug
plugin MP3Plug
plugin ProCitePlug
plugin RealMediaPlug
plugin SRCPlug
plugin ArcPlug
plugin RecPlug -use_metadata_files
format DateList "<td>[link][icon][/link]</td>
<td>[highlight]{Or}{[dls.Title],[dc.Title],[ex.Title],Untitled}[/highlight]<
/td>
<td>[ex.Date]</td>"
format HList "[link][highlight][ex.Title][/highlight][/link]"
format DocumentHeading "{Or}{[parent(Top):Title],[Title],untitled}<br>"
format DocumentText "[Text]"
format DocumentButtons "Detach|Highlight"
format VList "<td valign=\"top\">
<p></p>[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td>
<td valign=\"top\">
{If}{[ex.Source],<div align=\"justify\"><font
color=\"#333333\"><blockquote><strong><font size=\"2\">
[ex.srclink][arch.TipoDocumental][ex./srclink]</font></strong><br><p></p><bl
ockquote><em></em> <strong><font size=\"2\">Clasificación:</strong>
[arch.Seccion]:::::[arch.Subseccion]<p></p><strong>Productor / Procedencia:
</strong><em>[arch.Productor]</em><p></p><li><strong>Fecha: </strong>
[arch.FechaInicio]-[arch.FechaFinal] </li><strong>Lugar:
</strong>[arch.LugarProducc] <p></p><strong>Descripción:</strong>
[arch.Descripcion]</blockquote></i>}</font></div>"
collectionmeta collectionname [l=es] "Archivo"
collectionmeta iconcollection [l=es]
"_httpprefix_/collect/archivo/images/carchivo.jpg"
collectionmeta iconcollectionsmall [l=es]
"_httpprefix_/collect/archivo/images/logo_archivo.jpg"
collectionmeta .document:text [l=es] "text"
collectionmeta .document:Title [l=es] "titles"
collectionmeta .document:Source [l=es] "filenames"
collectionmeta .document [l=es] "document"
collectionmeta collectionextra [l=es] " ."
collectionmeta
.arch.Descripcion,arch.FechaFinal,arch.FechaInicio,arch.LugarProducc,arch.Pr
oductor,arch.Seccion,arch.Serie,arch.Subseccion,arch.Tipo2,arch.TipoDocument
al,arch.Unidaddesubseccion,/srclink,Creator,Date,Encoding,FileFormat,FileSiz
e,GENERATOR,Identifier,Image,ImageHeight,ImageSize,ImageType,ImageWidth,Lang
uage,NumPages,Plugin,Source,Thumb,ThumbHeight,ThumbType,ThumbWidth,Title,URL
,assocfilepath,hascover,srcicon,srclink,thumbicon,text [l=es] "la
descripción"
collectionmeta .arch.FechaFinal,arch.FechaInicio [l=es] "año"
El 11 de diciembre de 2008 14:27, Diego Spano <dspano@xxxxxxxxxxxx>
escribió:
Julian,
Qué versión de GS estás usando y en que sistema operativo?. Podés pegar el
collect.cfg para verlo?. El problema se produce cuando haces una búsqueda
con el formulario avanzado?.
Saludos
Diego
De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Julian Moyano
Enviado el: jueves, 11 de diciembre de 2008 11:18
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Buscar términos distintos campos
Hola a todos. Tras crear la colección me he dado cuenta que al realizar una
búsqueda, Greenstone no busca como quiero. Si preguntamos por dos términos
de búsqueda y están cada uno en diferentes campos, no los recupera. Y solo
encuentra si están esos términos en el mismo campo. He modificado varias
veces los índices de búsqueda, e incluso los plug-in por si acaso, pero no
he encontrado la solución. ¿alguna idea?
Saludos
www.manuelalbar.org
Other related posts:
- » [greenstone_es] RE: [greenstone_es] Re: [greenstone_es] RE: [greenstone_es] Buscar términos distintos camp os - Diego Spano