[greenstone_es] Re: RV: Re: Colecciones PDF

  • From: "Yolanda Meza" <ymeza@xxxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Fri, 17 Aug 2012 14:51:29 -0400

Hola Diego:

 

Procesa los archivos, pero no veo ninguna diferencia en el entorno web. Te
envío el txt de las dos colecciones que probé (pdf y libros).

Muchas gracias por la ayuda y por insistir conmigo. J

 

Atte,

 

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: viernes, 17 de agosto de 2012 13:50
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: RV: Re: Colecciones PDF

 

Mientras tanto Yolanda hagamos esto:

 

1- Sali del GLI

2- Edita el archivo c:\greenstone\collect\tu coleccion\etc\collect.cfg

3- Modifica el PDFPlugin de esta manera:

 

plugin  PDFPlugin -pdfbox_conversion

 

4- Graba el archivo

5- Abri una ventada de sistema

5- cd c:\greenstone<enter>

6- setup.bash<enter>

7- perl -S import.pl tu_coleccion

 

Te procesa todos los archivos?


Saludos!.

Diego



Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me:  Google Talk
<https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano  Skype
<https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano

 <http://www.linkedin.com/in/diegospano> 

 My QR VCard
<//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0
AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0
AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411
)%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon
sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L|0> 

 
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> Want a signature like mine?
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> CLICK HERE.   <http://pr1.wisestamp.com/p.gif?promo=21>   

 
<https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1345225492
802&u=2195e20d1a2e4f74> 

 

2012/8/17 Yolanda Meza <ymeza@xxxxxxxxxxxxx>

L Ok, muchas gracias. J

 

Yolanda Meza

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: viernes, 17 de agosto de 2012 12:24
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: RV: Re: Colecciones PDF

 

Nada por ahora Yolanda!


Saludos!.

Diego

Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me:  Google Talk
<https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano  Skype
<https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano

 <http://www.linkedin.com/in/diegospano> 

 My QR VCard
<//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0
AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0
AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411
)%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon
sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L%7C0> 

 
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> Want a signature like mine?
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> CLICK HERE.   <http://pr1.wisestamp.com/p.gif?promo=21>   

 
<https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1345220613
865&u=2195e20d1a2e4f74> 

 

2012/8/17 Yolanda Meza <ymeza@xxxxxxxxxxxxx>

Buen día Diego y miembros de la lista:

 

No hay novedades sobre mi problema con los PDF?s?? Si alguien me puede
ayudar, por favor.

Muchas gracias desde ya.

Atte,

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Yolanda Meza
Enviado el: martes, 14 de agosto de 2012 7:43
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 

Buen Día Diego:

 

Adjunto el archivo que solicitaste.

Muchas gracias.

Atte,

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: lunes, 13 de agosto de 2012 15:02
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 

Yolanda, enviame el archivo

 

c:\users\Dell\application data\greenstone\debug9-07-2012.txt


Saludos!.

Diego

Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me:  Google Talk
<https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano  Skype
<https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano

 <http://www.linkedin.com/in/diegospano> 

 My QR VCard
<//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0
AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0
AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411
)%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon
sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L%7C0> 

 
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> Want a signature like mine?
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> CLICK HERE.   <http://pr1.wisestamp.com/p.gif?promo=21>   

 
<https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1344884417
141&u=2195e20d1a2e4f74> 

 

2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx>

Hola Diego:

 

Sin novedad. Agregué 3 colecciones y sigue sucediendo lo mismo. Reconoce el
PDFBox pero no me aparecen las opciones en el PDFPlugin.

 

Espero realmente que haya alguna solución, los mismos problemas que tengo en
mi PC los tengo en el GS instalado en mi servidor. L

 

Te envío el dir.txt de greenstone-test, por si veas algo diferente.

 

Gracias por todo. J

 

Atte,

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: lunes, 13 de agosto de 2012 14:10
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 

Hola Yolanda. Todo parece estar en su lugar. No se que problema podés estar
teniendo. Hagamos una ultima prueba. Descargate un snapshot de GS desde esta
URL:

 

http://www.greenstone.org/caveat-emptor/ 

 

por ejemplo
<http://www.greenstone.org/caveat-emptor/Greenstone-2.85-candidate-2012.08.1
4-windows.exe> Greenstone-2.85-candidate-2012.08.14-windows.exe

 

Instalala en otra carpeta, por ej. c:\greenstone-test, agregale la extensión
pdfbox, copiale una coleccion cualquiera (la más chica!!!) desde
c:\greenstone\collect y tratá de ejecutar el gli y ver si te procesa bien.

 


Saludos!.

Diego

Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me: Descripción: Imagen quitada por el remitente. Google
Talkdiegospano Descripción: Imagen quitada por el remitente. Skypediegospano

 <http://www.linkedin.com/in/diegospano> Descripción: Imagen quitada por el
remitente.

Descripción: Imagen quitada por el remitente. My QR VCard

 
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> Want a signature like mine?
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> CLICK HERE. Descripción: Imagen quitada por el remitente.  

Descripción: Imagen quitada por el remitente.

 

2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx>

Hola Diego:

 

Ahora sí. J

Atte,

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: lunes, 13 de agosto de 2012 12:28


Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 

Hola Yolanda. No me sirve lo que me enviaste.

 

Necesito que ejecutes 

 

dir /b /s > dir.txt 

 

No vas a ver nada porque el sistema operativo va a grabar en el archivo
dir.txt todo lo que te hubiera mostrado en pantalla. Espera a que te vuelva
a aparecer c:\greenstone y luego enviame el dir.txt.

 


Saludos!.

Diego

Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me: ¡Error! Nombre de archivo no especificado.diegospano ¡Error!
Nombre de archivo no especificado.diegospano

 <http://www.linkedin.com/in/diegospano> ¡Error! Nombre de archivo no
especificado.

¡Error! Nombre de archivo no especificado.

 
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> Want a signature like mine?
<http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp.
com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp
aign%3Dpromo_21> CLICK HERE. ¡Error! Nombre de archivo no especificado.  

¡Error! Nombre de archivo no especificado.

 

2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx>

Hola Diego:

 

Hice lo que indicaste de la siguiente manera:

 

cd c:\greenstone

(enter)

dir /b /s

(enter)

 

 

Agregando ?dir /b /s > dir.txt? no pasaba nada.

 

Adjunto el archivo dir.txt de greenstone.

 

Muchas gracias por la ayuda.

 

Atte,

 

----------------------------------------------------------------------------
------

Yolanda Meza

División Nuevas Tecnologías

COPACO S.A.

Tel.: 021 226950 ? 021 202878

Fax: 021 219-2287

Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay

E-mail:  <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx

----------------------------------------------------------------------------
------

 

 

 

De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: jueves, 09 de agosto de 2012 14:56


Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 

Vamos por otro archivo. Abri una ventana de sistema y hace lo siguiente:

 

cd c:\greenstone

dir /b /s > dir.txt

 

y luego enviame el archivo c:\greenstone\dir.txt

 

Saludos!.

Diego

Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 

Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com
<http://www.prodigioconsultores.com/> 

Contact me: diegospano diegospano

 <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK
HERE.   

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2012/8/9 Yolanda Meza
<ymeza@xxxxxxxxxxxxx>

 <http://www.linkedin.com/in/diegospano> Hola Diego:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Adjunto imagen del gli ejecutado en
ventana de sistema.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Porfa no me digas que se te acaban
las ideas? :?(

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Espero que en la imagen encuentres
alguna anormalidad que se pueda solucionar. J

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Saludos,

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>
----------------------------------------------------------------------------
------

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano> División Nuevas Tecnologías

 <http://www.linkedin.com/in/diegospano> COPACO S.A.

 <http://www.linkedin.com/in/diegospano> Tel.: 021 226950 ? 021 202878

 <http://www.linkedin.com/in/diegospano> Fax: 021 219-2287

 <http://www.linkedin.com/in/diegospano> Teodoro S. Mongelos 2093 - Cód.
Postal 1565 ? Asunción - Paraguay

 <http://www.linkedin.com/in/diegospano> E-mail: ymeza@xxxxxxxxxxxxx

 <http://www.linkedin.com/in/diegospano>
----------------------------------------------------------------------------
------

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> De:
greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: jueves, 09 de agosto de 2012 11:34

 <http://www.linkedin.com/in/diegospano> 
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Yolanda,

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> si cuando abrís una ventana de
sistema y ejecutas "java" te está tomando el de Sun, entonces java no es el
problema. Y sinceramente se me están acabando las ideas.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Hagamos lo siguiente:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> - abri una ventana de sistema

 <http://www.linkedin.com/in/diegospano> - ejecuta lo siguiente:

 <http://www.linkedin.com/in/diegospano> cd c:\greenstone<enter>

 <http://www.linkedin.com/in/diegospano> setup.bat<enter>

 <http://www.linkedin.com/in/diegospano> cd gli<enter>

 <http://www.linkedin.com/in/diegospano> gli -debug

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Esto te va a generar en esta
ventana mensajes a medida que el Gli se va iniciando. Una vez que el GLI ya
esté disponible, copiamelos y enviamelos.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 
Saludos!.

Diego

 <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos,
Prodigio Consultores
Tel: (54 11) 5093-5313 

 <http://www.linkedin.com/in/diegospano> Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

 <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano

 <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK
HERE.   

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza
<ymeza@xxxxxxxxxxxxx>

 <http://www.linkedin.com/in/diegospano> Hola Diego:

 <http://www.linkedin.com/in/diegospano> Disculpa.. creo que no soy muy
clara o específica escribiendo.

 <http://www.linkedin.com/in/diegospano> Esta es la versión de Java que está
en el path (Java(TM) SE Runtime Environment (build 1.6.0_31-b05))

 <http://www.linkedin.com/in/diegospano> La otra, la que está en System32,
era la que te envié anteriormente por confusión cuando me preguntaste la
versión de java y donde tengo instalado el Greenstone. Sorry? :s

 <http://www.linkedin.com/in/diegospano> Entonces, la versión que tengo debo
cambiar?? (Java(TM) SE Runtime Environment (build 1.6.0_31-b05))

 <http://www.linkedin.com/in/diegospano> Atte,

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> De:
greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: miércoles, 08 de agosto de 2012 12:36

 <http://www.linkedin.com/in/diegospano> 
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Me parece raro que te esté tomando
un Java que está en la carpeta windows\system32. Me parece que no es el java
de SUN. Podés descargarlo de aca e instalarlo?

 <http://www.linkedin.com/in/diegospano>  

http://java.com/es/download/index.jsp
<http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 
Saludos!.

Diego

 <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos,
Prodigio Consultores
Tel: (54 11) 5093-5313 

 <http://www.linkedin.com/in/diegospano> Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

 <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano

 <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK
HERE.   

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza
<ymeza@xxxxxxxxxxxxx>

 <http://www.linkedin.com/in/diegospano> Hola Diego:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Probando en mi PC:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 1-      Java está definido en el
path de tu máquina?. Si vos abris una ventana de sistema y ejecutás "java",
el sistema operativo te encuentra el comando?.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Java está en el path (Java(TM) SE
Runtime Environment (build 1.6.0_31-b05))

 <http://www.linkedin.com/in/diegospano> Java(TM) Platform SE binary -
Versión: 6.0.310.5 (esta es la versión que se encuentra en
C:/Windows/System32)

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2- Reemplaza el archivo
c:\greenstone\ext\pdf-box\perllib\plugins\PDFConverter.pm con este que te
adjunto (primero hace copia del original por las dudas!). Luego cargá el GLI
y fijate si el pdfplugin tiene la opción para configurar pdfbox_conversion

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Reemplazando el archivo que
enviaste no puedo abrir ninguna colección. ?Error: La Colección en:
C:\Greenstone???\gli.col no se pudo abrir.?

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Al insertar el archivo
PDFConverter.pm que tenía anteriormente vuelve a funcionar como antes, sigo
sin ver las opciones del PDFBox.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Saludos,

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos,
Prodigio Consultores
Tel: (54 11) 5093-5313 

 <http://www.linkedin.com/in/diegospano> Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

 <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano

 <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK
HERE.   

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza
<ymeza@xxxxxxxxxxxxx>

 <http://www.linkedin.com/in/diegospano> Hola Diego:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Qué pena que no puedas ver mi pc L

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> En que carpeta tenés instalado GS?.
Que versión de Java tenés?

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> En mi PC:

 <http://www.linkedin.com/in/diegospano> C:\Greenstone

 <http://www.linkedin.com/in/diegospano> Java(TM) Platform SE binary -
Versión: 6.0.310.5

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> En el Servidor Windows:

 <http://www.linkedin.com/in/diegospano> F:\Greenstone

 <http://www.linkedin.com/in/diegospano> Versión de Java: creo que 1.7 (ver
imagen adjunta)

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Gracias. J

 <http://www.linkedin.com/in/diegospano> Atte,

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> De:
greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: miércoles, 08 de agosto de 2012 9:40

 <http://www.linkedin.com/in/diegospano> 
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Yolanda, seguramente está filtrada
la salida por eso no podes conectarte. Bueno, vamos punto por punto de lo
que planteabas...

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Estoy teniendo problemas con PDFBox
extensión.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Tengo instalado el GS 2.85 en mi PC
(Win 7 Professional) y en un servidor Windows y pronto voy a tener que
hacerlo en un servidor Linux.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Empecemos con tu pc. En que carpeta
tenes instalado GS?. Que versión de Java tenés?

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Cuando entro al GLI, desde mi PC y
servidor Windows, en la ventana DOS reconoce el PDFBox pero el PDFPlugin no
me muestra las opciones de on/off para el PDFBox.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Cuando creo colecciones con PDF y
otros formatos, solo reconoce los archivos de otros formatos (por ejemplo
JPG) pero tampoco puedo ver la colección en la interfaz web. En el archivo
de la colección no se crea la carpeta index, por lo que tengo que entrar al
archivo de la colección y copiar el archivo building para luego cambiarle el
nombre a index, entonces sí puedo ver la colección en la web pero solo con
los documentos en otros formatos, los documentos con formato PDF no los
carga.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Ya he intentado cambiando opciones
en el PDFPlugin, así como en los formatos de VList y DocumentText, los
índices de búsqueda y los clasificadores de exploración. También he
intentado reconstruir la colección manualmente pero no hubo ninguna
diferencia.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Además, tengo colecciones de
versiones anteriores de Greenstone que no puedo reconstruir porque cuando lo
hago no reconoce todos los archivos, por lo que las dejo como están, por el
momento. Las colecciones antiguas las puedo ver, pero los archivos pdf solo
pueden ser vistos en texto, el link del icono PDF no funciona. Intente
reconstruir la colección para cambiar de versión, como me explicaron en la
lista en inglés, pero no funcionó (envío adjunto la imagen de éste error así
como el build_log y fail.log de una colección de prueba de PDF?s llamada
(libros) que no me funciona).

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Espero tu respuesta, muchas gracias
nuevamente.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Atentamente,

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano> COPACO SA

 <http://www.linkedin.com/in/diegospano> Paraguay

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> De:
greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: miércoles, 01 de agosto de 2012 15:17
Para: greenstone_es@xxxxxxxxxxxxx
Asunto: [greenstone_es] Re: Colecciones PDF

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Hola Yolanda,

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> cuales son los problemas que tenés?

 <http://www.linkedin.com/in/diegospano> 
Saludos!.

Diego

 <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos,
Prodigio Consultores
Tel: (54 11) 5093-5313 

 <http://www.linkedin.com/in/diegospano> Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

 <http://www.linkedin.com/in/diegospano> Contact me: Descripción:
Descripción: Imagen quitada por el remitente. Google Talkdiegospano
Descripción: Descripción: Imagen quitada por el remitente. Skypediegospano

 <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen
quitada por el remitente.

 <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen
quitada por el remitente. My QR VCard

 <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK
HERE. Descripción: Descripción: Imagen quitada por el remitente.  

 <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen
quitada por el remitente.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> 2012/7/11 Yolanda Meza
<ymeza@xxxxxxxxxxxxx>

 <http://www.linkedin.com/in/diegospano> Hola:

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Tengo problemas para crear
colecciones PDF. (PDFBox descomprimido agregado al archivo ext de
Greenstone2.85)

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Configuración: (Agrego estos datos
de configuración por si sea de utilidad, solicitar más datos en caso de
necesidad)

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Formato>VList?<td
valign=?Top?>[link][icon][/link] </td><td
valign=?Top?>[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td>
<td
valign=?Top?>[highlight]{Or}{[dc.Title],[exp.Title],Untitled}[/highlight]{If
}{[ex.Source],<br><i>([ex.Source])</i>}</td>? 

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Formato>DocumentText?[Text]?

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> ¿Alguien me podría ayudar a
resolver este problema?

 <http://www.linkedin.com/in/diegospano> Agradezco desde ya.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Yolanda Meza

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano> 

 <http://www.linkedin.com/in/diegospano> 
  _____  


 

 

 

 

 

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano> 

 <http://www.linkedin.com/in/diegospano> 
  _____  


 

 

 

 

 

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano> 

 <http://www.linkedin.com/in/diegospano> 
  _____  


 

 

 

 

 

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano>  

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 <http://www.linkedin.com/in/diegospano> 

 <http://www.linkedin.com/in/diegospano> 
  _____  


 

 

 

 

 

 <http://www.linkedin.com/in/diegospano> Se certificó que el correo no
contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

  _____  

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

  _____  

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

  _____  

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

  _____  

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

 

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

  _____  

Se certificó que el correo no contiene virus.
Comprobada por AVG - www.avg.es
Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la
versión: 25/06/2012
Las Definiciones de virus internas están desactualizadas.

JPEG image

JPEG image

JPEG image

 general options (for ConvertBinaryFile):
  -convert_to <enum>                   (REQUIRED) Plugin converts to TEXT or
                                       HTML or various types of Image (e.g.
                                       JPEG, GIF, PNG).
                                       Default: auto

                                       auto: Automatically select the format
                                         converted to. Format chosen depends on
                                         input document type, for example Word
                                         will automatically be converted to
                                         HTML, whereas PowerPoint will be
                                         converted to Greenstone's PagedImage
                                         format.
                                       html: HTML format.
                                       text: Plain text format.

  -keep_original_filename              Keep the original filename for the
                                       associated file, rather than converting
                                       to doc.pdf, doc.doc etc.

  -title_sub <string>                  Substitution expression to modify string
                                       stored as Title. Used by, for example,
                                       PDFPlugin to remove "Page 1", etc from
                                       text used as the title.
                                       Default:

  -apply_fribidi                       Run the "fribidi" Unicode Bidirectional
                                       Algorithm program over the converted file

                                       (for right-to-left text).

  -use_strings                         If set, a simple strings function will be

                                       called to extract text if the conversion
                                       utility fails.

 general options (for AutoExtractMetadata):
  -first <string>                      Comma separated list of numbers of
                                       characters to extract from the start of
                                       the text into a set of metadata fields
                                       called 'FirstN', where N is the size. For

                                       example, the values "3,5,7" will extract
                                       the first 3, 5 and 7 characters into
                                       metadata fields called "First3", "First5"

                                       and "First7".

 general options (for AcronymExtractor):
  -extract_acronyms                    Extract acronyms from within text and set

                                       as metadata.

  -markup_acronyms                     Add acronym metadata into document text.

 general options (for KeyphraseExtractor):
  -extract_keyphrases                  Extract keyphrases automatically with Kea

                                       (default settings).

  -extract_keyphrases_kea4             Extract keyphrases automatically with Kea

                                       4.0 (default settings). Kea 4.0 is a new
                                       version of Kea that has been developed
                                       for controlled indexing of documents in
                                       the domain of agriculture.

  -extract_keyphrase_options <string>  Options for keyphrase extraction with
                                       Kea. For example: mALIWEB - use ALIWEB
                                       extraction model; n5 - extract 5
                                       keyphrase;, eGBK - use GBK encoding.
                                       Default:

 general options (for EmailAddressExtractor):
  -extract_email                       Extract email addresses as metadata.

  -new_extract_email

 general options (for DateExtractor):
  -extract_historical_years            Extract time-period information from
                                       historical documents.  This is stored as
                                       metadata with the document. There is a
                                       search interface for this metadata, which

                                       you can include in your collection by
                                       adding the statement, "format
                                       QueryInterface DateSearch" to your
                                       collection configuration file.

  -maximum_year <int>                  The maximum historical date to be used as

                                       metadata (in a Common Era date, such as
                                       1950).
                                       Default: 2012

  -maximum_century <string>            The maximum named century to be extracted

                                       as historical metadata (e.g. 14 will
                                       extract all references up to the 14th
                                       century).
                                       Default: -1

  -no_bibliography                     Do not try to block bibliographic dates
                                       when extracting historical dates.

 general options (for GISExtractor):
  -extract_placenames                  Extract placenames from within text and
                                       set as metadata. Requires GIS extension
                                       to Greenstone.

  -gazetteer <string>                  Gazetteer to use to extract placenames
                                       from within text and set as metadata.
                                       Requires GIS extension to Greenstone.

  -place_list                          When extracting placements, include list
                                       of placenames at start of the document.
                                       Requires GIS extension to Greenstone.

 general options (for BasePlugin):
  -process_exp <regexp>                A perl regular expression to match
                                       against filenames. Matching filenames
                                       will be processed by this plugin. For
                                       example, using '(?i).html?\$' matches all

                                       documents ending in .htm or .html
                                       (case-insensitive).
                                       Default:

  -no_blocking                         Don't do any file blocking. Any
                                       associated files (e.g. images in a web
                                       page) will be added to the collection as
                                       documents in their own right.

  -block_exp <regexp>                  Files matching this regular expression
                                       will be blocked from being passed to any
                                       later plugins in the list.
                                       Default:

  -store_original_file                 Save the original source document as an
                                       associated file. Note this is already
                                       done for files like PDF, Word etc. This
                                       option is only useful for plugins that
                                       don't already store a copy of the
                                       original file.

  -associate_ext <string>              Causes files with the same root filename
                                       as the document being processed by the
                                       plugin AND a filename extension from the
                                       comma separated list provided by this
                                       argument to be associated with the
                                       document being processed rather than
                                       handled as a separate list.

  -associate_tail_re <string>          A regular expression to match filenames
                                       against to find associated files. Used as

                                       a more powerful alternative to
                                       associate_ext.

  -OIDtype <enum>                      The method to use when generating unique
                                       identifiers for each document.
                                       Default: auto

                                       auto: Use OIDtype set in import.pl
                                       hash: Hash the contents of the file.
                                         Document identifiers will be the same
                                         every time the collection is imported.
                                       hash_on_ga_xml: Hash the contents of the
                                         Greenstone Archive XML file. Document
                                         identifiers will be the same every time

                                         the collection is imported as long as
                                         the metadata does not change.
                                       assigned: Use the metadata value given by

                                         the OIDmetadata option (preceded by
                                         'D'); if unspecified, for a particular
                                         document a hash is used instead. These
                                         identifiers should be unique.
                                       incremental: Use a simple document count.

                                         Significantly faster than "hash", but
                                         does not necessarily assign the same
                                         identifier to the same document content

                                         if the collection is reimported.
                                       dirname: Use the parent directory name
                                         (preceded by 'J'). There should only be

                                         one document per directory, and
                                         directory names should be unique. E.g.
                                         import/b13as/h15ef/page.html will get
                                         an identifier of Jh15ef.

  -OIDmetadata <metadata>              Specifies the metadata element that
                                       hold's the document's unique identifier,
                                       for use with -OIDtype=assigned.
                                       Default: dc.Identifier

  -no_cover_image                      Do not look for a prefix.jpg file (where
                                       prefix is the same prefix as the file
                                       being processed) to associate as a cover
                                       image.

  -filename_encoding <enum>            The encoding of the source file
                                       filenames.
                                       Default: auto

                                       auto: Automatically detect the encoding o
f
                                         the filename.
                                       auto-language-analysis: Auto-detect the
                                         encoding of the filename by analysing
                                         it.
                                       auto-filesystem-encoding: Auto-detect the

                                         encoding of the filename using
                                         filesystem encoding.
                                       auto-fl: Uses filesystem encoding then
                                         language analysis to detect the
                                         filename encoding.
                                       auto-lf: Uses language analysis then
                                         filesystem encoding to detect the
                                         filename encoding.
                                       ascii: Plain 7 bit ASCII. This may be a
                                         bit faster than using iso_8859_1.
                                         Beware of using this when the text may
                                         contain characters outside the plain 7
                                         bit ASCII set though (e.g. German or
                                         French text containing accents), use
                                         iso_8859_1 instead.
                                       utf8: Either utf8 or unicode --
                                         automatically detected.
                                       unicode: Just unicode.
                                       iso_8859_6: Arabic
                                       gb: Chinese Simplified (GB)
                                       big5: Chinese Traditional (Big5)
                                       koi8_r: Cyrillic
                                       iso_8859_5: Cyrillic
                                       koi8_u: Cyrillic (Ukrainian)
                                       dos_437: DOS codepage 437 (US English)
                                       dos_850: DOS codepage 850 (Latin 1)
                                       dos_852: DOS codepage 852 (Central
                                         European)
                                       dos_866: DOS codepage 866 (Cyrillic)
                                       iso_8859_7: Greek
                                       iso_8859_8: Hebrew
                                       iscii_de: ISCII Devanagari
                                       euc_jp: Japanese (EUC)
                                       shift_jis: Japanese (Shift-JIS)
                                       korean: Korean (Unified Hangul Code - i.e
.
                                         a superset of EUC-KR)
                                       iso_8859_1: Latin1 (western languages)
                                       iso_8859_15: Latin15 (revised western)
                                       iso_8859_2: Latin2 (central and eastern
                                         european languages)
                                       iso_8859_3: Latin3
                                       iso_8859_4: Latin4
                                       iso_8859_9: Turkish
                                       windows_1250: Windows codepage 1250
                                         (WinLatin2)
                                       windows_1251: Windows codepage 1251
                                         (WinCyrillic)
                                       windows_1252: Windows codepage 1252
                                         (WinLatin1)
                                       windows_1253: Windows codepage 1253
                                         (WinGreek)
                                       windows_1254: Windows codepage 1254
                                         (WinTurkish)
                                       windows_1255: Windows codepage 1255
                                         (WinHebrew)
                                       windows_1256: Windows codepage 1256
                                         (WinArabic)
                                       windows_1257: Windows codepage 1257
                                         (WinBaltic)
                                       windows_1258: Windows codepage 1258
                                         (Vietnamese)
                                       windows_874: Windows codepage 874 (Thai)

  -smart_block                          SUPERSEDED.
                                       Block files in a smarter way than just lo
oking at filenames.

  -file_rename_method <enum>           The method to be used in renaming the
                                       copy of the imported file and associated
                                       files.
                                       Default: url

                                       url: Use url encoding in renaming importe
d
                                         files and associated files.
                                       base64: Use base64 encoding in renaming
                                         imported files and associated files.
                                       none: Don't rename imported files and
                                         associated files.



c:\Greenstone>
 general options (for ConvertBinaryFile):
  -convert_to <enum>                   (REQUIRED) Plugin converts to TEXT or
                                       HTML or various types of Image (e.g.
                                       JPEG, GIF, PNG).
                                       Default: auto

                                       auto: Automatically select the format
                                         converted to. Format chosen depends on
                                         input document type, for example Word
                                         will automatically be converted to
                                         HTML, whereas PowerPoint will be
                                         converted to Greenstone's PagedImage
                                         format.
                                       html: HTML format.
                                       text: Plain text format.

  -keep_original_filename              Keep the original filename for the
                                       associated file, rather than converting
                                       to doc.pdf, doc.doc etc.

  -title_sub <string>                  Substitution expression to modify string
                                       stored as Title. Used by, for example,
                                       PDFPlugin to remove "Page 1", etc from
                                       text used as the title.
                                       Default:

  -apply_fribidi                       Run the "fribidi" Unicode Bidirectional
                                       Algorithm program over the converted file

                                       (for right-to-left text).

  -use_strings                         If set, a simple strings function will be

                                       called to extract text if the conversion
                                       utility fails.

 general options (for AutoExtractMetadata):
  -first <string>                      Comma separated list of numbers of
                                       characters to extract from the start of
                                       the text into a set of metadata fields
                                       called 'FirstN', where N is the size. For

                                       example, the values "3,5,7" will extract
                                       the first 3, 5 and 7 characters into
                                       metadata fields called "First3", "First5"

                                       and "First7".

 general options (for AcronymExtractor):
  -extract_acronyms                    Extract acronyms from within text and set

                                       as metadata.

  -markup_acronyms                     Add acronym metadata into document text.

 general options (for KeyphraseExtractor):
  -extract_keyphrases                  Extract keyphrases automatically with Kea

                                       (default settings).

  -extract_keyphrases_kea4             Extract keyphrases automatically with Kea

                                       4.0 (default settings). Kea 4.0 is a new
                                       version of Kea that has been developed
                                       for controlled indexing of documents in
                                       the domain of agriculture.

  -extract_keyphrase_options <string>  Options for keyphrase extraction with
                                       Kea. For example: mALIWEB - use ALIWEB
                                       extraction model; n5 - extract 5
                                       keyphrase;, eGBK - use GBK encoding.
                                       Default:

 general options (for EmailAddressExtractor):
  -extract_email                       Extract email addresses as metadata.

  -new_extract_email

 general options (for DateExtractor):
  -extract_historical_years            Extract time-period information from
                                       historical documents.  This is stored as
                                       metadata with the document. There is a
                                       search interface for this metadata, which

                                       you can include in your collection by
                                       adding the statement, "format
                                       QueryInterface DateSearch" to your
                                       collection configuration file.

  -maximum_year <int>                  The maximum historical date to be used as

                                       metadata (in a Common Era date, such as
                                       1950).
                                       Default: 2012

  -maximum_century <string>            The maximum named century to be extracted

                                       as historical metadata (e.g. 14 will
                                       extract all references up to the 14th
                                       century).
                                       Default: -1

  -no_bibliography                     Do not try to block bibliographic dates
                                       when extracting historical dates.

 general options (for GISExtractor):
  -extract_placenames                  Extract placenames from within text and
                                       set as metadata. Requires GIS extension
                                       to Greenstone.

  -gazetteer <string>                  Gazetteer to use to extract placenames
                                       from within text and set as metadata.
                                       Requires GIS extension to Greenstone.

  -place_list                          When extracting placements, include list
                                       of placenames at start of the document.
                                       Requires GIS extension to Greenstone.

 general options (for BasePlugin):
  -process_exp <regexp>                A perl regular expression to match
                                       against filenames. Matching filenames
                                       will be processed by this plugin. For
                                       example, using '(?i).html?\$' matches all

                                       documents ending in .htm or .html
                                       (case-insensitive).
                                       Default:

  -no_blocking                         Don't do any file blocking. Any
                                       associated files (e.g. images in a web
                                       page) will be added to the collection as
                                       documents in their own right.

  -block_exp <regexp>                  Files matching this regular expression
                                       will be blocked from being passed to any
                                       later plugins in the list.
                                       Default:

  -store_original_file                 Save the original source document as an
                                       associated file. Note this is already
                                       done for files like PDF, Word etc. This
                                       option is only useful for plugins that
                                       don't already store a copy of the
                                       original file.

  -associate_ext <string>              Causes files with the same root filename
                                       as the document being processed by the
                                       plugin AND a filename extension from the
                                       comma separated list provided by this
                                       argument to be associated with the
                                       document being processed rather than
                                       handled as a separate list.

  -associate_tail_re <string>          A regular expression to match filenames
                                       against to find associated files. Used as

                                       a more powerful alternative to
                                       associate_ext.

  -OIDtype <enum>                      The method to use when generating unique
                                       identifiers for each document.
                                       Default: auto

                                       auto: Use OIDtype set in import.pl
                                       hash: Hash the contents of the file.
                                         Document identifiers will be the same
                                         every time the collection is imported.
                                       hash_on_ga_xml: Hash the contents of the
                                         Greenstone Archive XML file. Document
                                         identifiers will be the same every time

                                         the collection is imported as long as
                                         the metadata does not change.
                                       assigned: Use the metadata value given by

                                         the OIDmetadata option (preceded by
                                         'D'); if unspecified, for a particular
                                         document a hash is used instead. These
                                         identifiers should be unique.
                                       incremental: Use a simple document count.

                                         Significantly faster than "hash", but
                                         does not necessarily assign the same
                                         identifier to the same document content

                                         if the collection is reimported.
                                       dirname: Use the parent directory name
                                         (preceded by 'J'). There should only be

                                         one document per directory, and
                                         directory names should be unique. E.g.
                                         import/b13as/h15ef/page.html will get
                                         an identifier of Jh15ef.

  -OIDmetadata <metadata>              Specifies the metadata element that
                                       hold's the document's unique identifier,
                                       for use with -OIDtype=assigned.
                                       Default: dc.Identifier

  -no_cover_image                      Do not look for a prefix.jpg file (where
                                       prefix is the same prefix as the file
                                       being processed) to associate as a cover
                                       image.

  -filename_encoding <enum>            The encoding of the source file
                                       filenames.
                                       Default: auto

                                       auto: Automatically detect the encoding o
f
                                         the filename.
                                       auto-language-analysis: Auto-detect the
                                         encoding of the filename by analysing
                                         it.
                                       auto-filesystem-encoding: Auto-detect the

                                         encoding of the filename using
                                         filesystem encoding.
                                       auto-fl: Uses filesystem encoding then
                                         language analysis to detect the
                                         filename encoding.
                                       auto-lf: Uses language analysis then
                                         filesystem encoding to detect the
                                         filename encoding.
                                       ascii: Plain 7 bit ASCII. This may be a
                                         bit faster than using iso_8859_1.
                                         Beware of using this when the text may
                                         contain characters outside the plain 7
                                         bit ASCII set though (e.g. German or
                                         French text containing accents), use
                                         iso_8859_1 instead.
                                       utf8: Either utf8 or unicode --
                                         automatically detected.
                                       unicode: Just unicode.
                                       iso_8859_6: Arabic
                                       gb: Chinese Simplified (GB)
                                       big5: Chinese Traditional (Big5)
                                       koi8_r: Cyrillic
                                       iso_8859_5: Cyrillic
                                       koi8_u: Cyrillic (Ukrainian)
                                       dos_437: DOS codepage 437 (US English)
                                       dos_850: DOS codepage 850 (Latin 1)
                                       dos_852: DOS codepage 852 (Central
                                         European)
                                       dos_866: DOS codepage 866 (Cyrillic)
                                       iso_8859_7: Greek
                                       iso_8859_8: Hebrew
                                       iscii_de: ISCII Devanagari
                                       euc_jp: Japanese (EUC)
                                       shift_jis: Japanese (Shift-JIS)
                                       korean: Korean (Unified Hangul Code - i.e
.
                                         a superset of EUC-KR)
                                       iso_8859_1: Latin1 (western languages)
                                       iso_8859_15: Latin15 (revised western)
                                       iso_8859_2: Latin2 (central and eastern
                                         european languages)
                                       iso_8859_3: Latin3
                                       iso_8859_4: Latin4
                                       iso_8859_9: Turkish
                                       windows_1250: Windows codepage 1250
                                         (WinLatin2)
                                       windows_1251: Windows codepage 1251
                                         (WinCyrillic)
                                       windows_1252: Windows codepage 1252
                                         (WinLatin1)
                                       windows_1253: Windows codepage 1253
                                         (WinGreek)
                                       windows_1254: Windows codepage 1254
                                         (WinTurkish)
                                       windows_1255: Windows codepage 1255
                                         (WinHebrew)
                                       windows_1256: Windows codepage 1256
                                         (WinArabic)
                                       windows_1257: Windows codepage 1257
                                         (WinBaltic)
                                       windows_1258: Windows codepage 1258
                                         (Vietnamese)
                                       windows_874: Windows codepage 874 (Thai)

  -smart_block                          SUPERSEDED.
                                       Block files in a smarter way than just lo
oking at filenames.

  -file_rename_method <enum>           The method to be used in renaming the
                                       copy of the imported file and associated
                                       files.
                                       Default: url

                                       url: Use url encoding in renaming importe
d
                                         files and associated files.
                                       base64: Use base64 encoding in renaming
                                         imported files and associated files.
                                       none: Don't rename imported files and
                                         associated files.



c:\Greenstone>

Other related posts: