[greenstone_es] Re: Segmentation Fault

  • From: marcelo yornet <baryornet@xxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Tue, 23 Nov 2010 19:41:42 -0300

PIntaba con lógica la solución pero no funcionó.
Si estaba usando stemmig y la verdad que quiero usarlo porque como además los 
textos viene de OCR aumenta las posibilidades de encontrar lo que quiero. Pero 
para probar construí la colección de nuevo (la hice desde import porque 
necesitaba meter otros metadatos). Bueno, eliminé el stem y en el mismo lugar 
tuve el mismo error. Así que sigo sin idea ni de a que se debe, ni si perjudica 
o no. Osea lo que me preocupa es que no tengo seguridad de que este funcionando 
todo mi indice.

Así que me parece que la vuelvo a reconstruir para aprovechar el stemming 
¿Se puede reemplazar el diccionario? ¿Se puede usar un diccionario propio?

Saludos

Marcelo Yornet

> From: diegospano@xxxxxxxxx
> Date: Sat, 20 Nov 2010 16:53:00 -0300
> Subject: [greenstone_es] Re: Segmentation Fault
> To: greenstone_es@xxxxxxxxxxxxx
> 
> Marcelo, por lo que comentás da error cuando quiere crear el indice
> usando el stemming o truncamiento de palabras. El diccionario de
> stemming que trae es muy preciso para Inglés pero no para el español,
> con lo cual los resultados de las búsquedas pueden ser incorrectos.
> Podés probar deshabilitando dicha opcion del collect.cfg?
> 
> seguramente tenés una línea que dice:
> 
> 
> indexoptions  casefold stem accentfold
> 
> modificala para que quede así:
> 
> indexoptions  casefold accentfold
> 
> y luego ejecutá el proceso de build solamente, ya que el import no es 
> necesario.
> 
> 
> Saludos!.
> 
> Diego
> 
> Diego Spano
> Prodigio Consultores
> Capital Federal - Argentina
> Tel: (54 11) 5093-5313
> http://ar.linkedin.com/in/diegospano
> www.prodigioconsultores.com
> 
> 
> 
> 2010/11/17 marcelo yornet <baryornet@xxxxxxxxxxx>:
> > Bueno, retomo este error.
> > Estoy trabajando sobre ubuntu server 10.4 Utilizo greenstone 2.83 con perl
> > 5.8.9 y mgpp como indexer.
> > Uso pagedimage plugin para hacer colecciones de imagenes paginadas.
> >
> > El tema es así:
> >
> > Durante el proceso de buildcol.pl el greenstonexmlplugin realiza varias
> > pasadas sobre los archivos doc.xml que generó import.pl en el log de la
> > operación los divide en dos pasos: Creando el texto comprimido y
> > Construyendo los indices. Los primeros los nomina como pasos T y los
> > segundos como pasos I
> > Los dos primeros del paso 1 Recogiendo estadisticas de texto T1 y  Creación
> > del diccionario comprimido T2 funcionan sin problema.
> > El tercer paso construyendo diccionario de indices I1 tampoco da problemas.
> > El problema se produce en la cuarta pasada Invirtiendo el texto I2 donde
> > realiza todo el trabajo, hace tres acciones "Create the weights file",
> > "Creating 'on-disk' stemmed dictionary" y en creatin stem indexes es cuando
> > falla. Me da un error "segmentation fault" por cada indice.
> > Luego de esto continuan los procesos "Creating the info database and
> > processing associated files" "Outputting information for classifier..." y
> > termina.
> > El resultado parece funcionar correctamente.
> >
> > Pero por eso quería preguntar a que se refiere ese error, si hay que tenerlo
> > en cuenta o no.
> >
> > Saludos a todos.
> >
> > Marcelo Yornet
> >
> >> From: diegospano@xxxxxxxxx
> >> Date: Mon, 8 Nov 2010 10:46:03 -0300
> >> Subject: [greenstone_es] Re: Segmentation Fault
> >> To: greenstone_es@xxxxxxxxxxxxx
> >>
> >> Copiame el error, asi lo entiendo mejor. Estás usando Perl 5.8.9, no?.
> >> Y Lucene o MGPP?
> >>
> >> Saludos!.
> >>
> >> Diego
> >>
> >>
> >> 2010/11/8 marcelo yornet <baryornet@xxxxxxxxxxx>:
> >> > Uso ubuntu server 10.4  de 64 bits con greenstone 2.83 y visualizo el
> >> > error
> >> > en la consola luego del proceso buildcol.pl.
> >> >
> >> > Si queres en un rato te copio y pego el mensaje.
> >> >
> >> > Saludos y gracias
> >> >
> >> >> From: diegospano@xxxxxxxxx
> >> >> Date: Mon, 8 Nov 2010 10:29:58 -0300
> >> >> Subject: [greenstone_es] Re: Segmentation Fault
> >> >> To: greenstone_es@xxxxxxxxxxxxx
> >> >>
> >> >> Marcelo,
> >> >>
> >> >> segmentation fault es un error que se produce en Linux cuando hay
> >> >> problemas de acceso a memoria. Qué sistema operativo estás usando?.
> >> >> Qué motor de indexación?. Qué versión de GS?. Donde visualizás el
> >> >> error?
> >> >>
> >> >> Saludos!.
> >> >>
> >> >> Diego
> >> >>
> >> >>
> >> >>
> >> >> 2010/11/3 marcelo yornet <baryornet@xxxxxxxxxxx>:
> >> >> > Hola a la lista:
> >> >> >
> >> >> > Necesitaba preguntarles por este ¿error? que me aparece durante el
> >> >> > proceso
> >> >> > de construcción, buildcol.pl.
> >> >> >
> >> >> > La colección parece funcionar bien, y responde bien a las busquedas
> >> >> > pero
> >> >> > me
> >> >> > aparece recurrentemente este mensaje de "Segmentatio Fault".
> >> >> > Si alguien me puede explicar a que se debe si es algo a corregir o si
> >> >> > no
> >> >> > hay
> >> >> > que darle importancia.
> >> >> >
> >> >> > Gracias.
> >> >> >
> >> >> > Marcelo Yornet
> >> >> >
> >> >>
> >> >
> >>
> >
> 
                                          

Other related posts: