[greenstone_es] Re: Dudas
- From: "Diego Spano" <dspano@xxxxxxxxxxxx>
- To: <greenstone_es@xxxxxxxxxxxxx>
- Date: Tue, 10 Feb 2009 16:30:24 -0200
Oilda,
Hay varias cuestiones a tener en cuenta.
EL Minimal rebuild solo existe cuando usas el motor Lucene. No funciona con
MG ni MGPP.
NO UTILICES EL GLI PARA CONSTRUIR LA COLECCION BAJO NINGUN CONCEPTO!!!!!!.
El Gli es una herramienta que te permite crear la colección, definir sus
indices y formatos, y procesar un pequeño conjunto de documentos. Una vez
que hiciste esa prueba y la colección quedó como realmente querias, entonces
empezas a manejarte con linea de comandos, porque de otra manera el GLI que
está hecho en Java te va a seguir dando ese error de overflow. Cómo se hace
por linea de comandos? De la siguiente manera:
Asumamos que tenes instalado GS en c:\greenstone2 y que la colección se
llama docs y que en la carpeta docs/import tenes todos los pdfs. Entonces se
debe hacer lo siguiente:
1- Desde el menú Inicio de Windows ejecutás el comando cmd.
2- Luego en esa nueva ventana ejecutás:
a- cd c:\greenstone2 <enter>
b- setup.bat <enter>
c- perl ?S import.pl docs <enter>
d-perl ?S buildcol.pl docs <enter>
3- Luego borrás las carpeta index que tenias generada de antes y
renombrás las carpeta building como index.
De esta manera quedaría indexada toda la colección.
Probalo para ver si te funciona. Si llegaras a tener algun problema avisame.
Saludos
Diego Spano
4-
De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Oilda Borrajo Garit
Enviado el: martes, 10 de febrero de 2009 14:04
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Dudas
Tengo un problema bastante complicado utilizando el colector; me sucede que
tengo una colección de libros en formato electronico, la gran mayoria de
ellos en formato PDF el unico detalle es que esta colección se puede
considerar mediana pues ocupa unos 42GB. Me he decidido a utilizar el
colector para adicionarlos a una colección en mi librería greenstone y he
comenzado a hacerlo pero siempre recibo un error de Heap Overflow en la
consola del java de mi cliente greenstone client-gli. He probado las
siguientes variantes:
En una PC con 512MB de RAM:
. Arrastrar toda mi colección de libros a la librería que estoy por crear
Cambie a una PC con 2GB de RAM:
. Arrastrar en grupos de carpeta con tamanno aproximado de 500MB e ir
creando la colección con la opcion de ?Minimal Build?
. Arrastrar una a una las carpetas y en cada caso ir creando la colección
con la opcion de ?Minimal Build?
? ( he probado otras variantes mas omologas a las que puse anteriormente,
pero no quisiera abrumar con tantos detalles ) ?
Solo me resta ir adicionando documento a documento, pero como en todos los
casos el error de Heap Overflow persiste pues tengo el temor de luego de
haber indexado varios cientos de documentos reciba nuevamente el error.
Sospecho que por alguna razon el Colector carga en memoria TODOS los libros
que procesa, o quizas carga en memoria toda la colección que creara ya sea
con minimal build o no; es asi ¿ Como pudiera resolver mi problema ¿ De ser
asi es imposible indexar colecciones medianas o grandes, ya que necesitaria
una PC con 42GB de memoria RAM ¿
Gracias de antemano!!
Other related posts: