Hola Diego: Procesa los archivos, pero no veo ninguna diferencia en el entorno web. Te envío el txt de las dos colecciones que probé (pdf y libros). Muchas gracias por la ayuda y por insistir conmigo. J Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: viernes, 17 de agosto de 2012 13:50 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: RV: Re: Colecciones PDF Mientras tanto Yolanda hagamos esto: 1- Sali del GLI 2- Edita el archivo c:\greenstone\collect\tu coleccion\etc\collect.cfg 3- Modifica el PDFPlugin de esta manera: plugin PDFPlugin -pdfbox_conversion 4- Graba el archivo 5- Abri una ventada de sistema 5- cd c:\greenstone<enter> 6- setup.bash<enter> 7- perl -S import.pl tu_coleccion Te procesa todos los archivos? Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: Google Talk <https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano Skype <https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano <http://www.linkedin.com/in/diegospano> My QR VCard <//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0 AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0 AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411 )%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L|0> <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> Want a signature like mine? <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> CLICK HERE. <http://pr1.wisestamp.com/p.gif?promo=21> <https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1345225492 802&u=2195e20d1a2e4f74> 2012/8/17 Yolanda Meza <ymeza@xxxxxxxxxxxxx> L Ok, muchas gracias. J Yolanda Meza De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: viernes, 17 de agosto de 2012 12:24 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: RV: Re: Colecciones PDF Nada por ahora Yolanda! Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: Google Talk <https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano Skype <https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano <http://www.linkedin.com/in/diegospano> My QR VCard <//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0 AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0 AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411 )%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L%7C0> <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> Want a signature like mine? <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> CLICK HERE. <http://pr1.wisestamp.com/p.gif?promo=21> <https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1345220613 865&u=2195e20d1a2e4f74> 2012/8/17 Yolanda Meza <ymeza@xxxxxxxxxxxxx> Buen día Diego y miembros de la lista: No hay novedades sobre mi problema con los PDF?s?? Si alguien me puede ayudar, por favor. Muchas gracias desde ya. Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Yolanda Meza Enviado el: martes, 14 de agosto de 2012 7:43 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF Buen Día Diego: Adjunto el archivo que solicitaste. Muchas gracias. Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: lunes, 13 de agosto de 2012 15:02 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF Yolanda, enviame el archivo c:\users\Dell\application data\greenstone\debug9-07-2012.txt Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: Google Talk <https://s3.amazonaws.com/images.wisestamp.com/gtalk.png> diegospano Skype <https://s3.amazonaws.com/images.wisestamp.com/skype.png> diegospano <http://www.linkedin.com/in/diegospano> My QR VCard <//chart.googleapis.com/chart?chs=106x106&cht=qr&chl=BEGIN%3AVCARD%0D%0 AVERSION%3A2.1%0D%0AN%3ASpano%3BDiego%0D%0AORG%3AProdigio%20Consultores%0D%0 AADR%3A%3B%3B%3BBuenos%20Aires%20-%20Argentina%3B%3B%0D%0ATEL%3BCELL%3A(5411 )%205093-5313%0D%0AEMAIL%3Adiegospano%40gmail.com%0D%0AURL%3Awww.prodigiocon sultores.com%0D%0AEND%3AVCARD%0D%0A&choe=UTF-8&chld=L%7C0> <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> Want a signature like mine? <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> CLICK HERE. <http://pr1.wisestamp.com/p.gif?promo=21> <https://wisestamp.appspot.com/pixel.png?p=chrome&v=3.11.16.100&t=1344884417 141&u=2195e20d1a2e4f74> 2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx> Hola Diego: Sin novedad. Agregué 3 colecciones y sigue sucediendo lo mismo. Reconoce el PDFBox pero no me aparecen las opciones en el PDFPlugin. Espero realmente que haya alguna solución, los mismos problemas que tengo en mi PC los tengo en el GS instalado en mi servidor. L Te envío el dir.txt de greenstone-test, por si veas algo diferente. Gracias por todo. J Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: lunes, 13 de agosto de 2012 14:10 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF Hola Yolanda. Todo parece estar en su lugar. No se que problema podés estar teniendo. Hagamos una ultima prueba. Descargate un snapshot de GS desde esta URL: http://www.greenstone.org/caveat-emptor/ por ejemplo <http://www.greenstone.org/caveat-emptor/Greenstone-2.85-candidate-2012.08.1 4-windows.exe> Greenstone-2.85-candidate-2012.08.14-windows.exe Instalala en otra carpeta, por ej. c:\greenstone-test, agregale la extensión pdfbox, copiale una coleccion cualquiera (la más chica!!!) desde c:\greenstone\collect y tratá de ejecutar el gli y ver si te procesa bien. Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: Descripción: Imagen quitada por el remitente. Google Talkdiegospano Descripción: Imagen quitada por el remitente. Skypediegospano <http://www.linkedin.com/in/diegospano> Descripción: Imagen quitada por el remitente. Descripción: Imagen quitada por el remitente. My QR VCard <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> Want a signature like mine? <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> CLICK HERE. Descripción: Imagen quitada por el remitente. Descripción: Imagen quitada por el remitente. 2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx> Hola Diego: Ahora sí. J Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: lunes, 13 de agosto de 2012 12:28 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF Hola Yolanda. No me sirve lo que me enviaste. Necesito que ejecutes dir /b /s > dir.txt No vas a ver nada porque el sistema operativo va a grabar en el archivo dir.txt todo lo que te hubiera mostrado en pantalla. Espera a que te vuelva a aparecer c:\greenstone y luego enviame el dir.txt. Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: ¡Error! Nombre de archivo no especificado.diegospano ¡Error! Nombre de archivo no especificado.diegospano <http://www.linkedin.com/in/diegospano> ¡Error! Nombre de archivo no especificado. ¡Error! Nombre de archivo no especificado. <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> Want a signature like mine? <http://r1.wisestamp.com/r/landing?promo=21&dest=http%3A%2F%2Fwww.wisestamp. com%2Femail-install%3Futm_source%3Dextension%26utm_medium%3Demail%26utm_camp aign%3Dpromo_21> CLICK HERE. ¡Error! Nombre de archivo no especificado. ¡Error! Nombre de archivo no especificado. 2012/8/13 Yolanda Meza <ymeza@xxxxxxxxxxxxx> Hola Diego: Hice lo que indicaste de la siguiente manera: cd c:\greenstone (enter) dir /b /s (enter) Agregando ?dir /b /s > dir.txt? no pasaba nada. Adjunto el archivo dir.txt de greenstone. Muchas gracias por la ayuda. Atte, ---------------------------------------------------------------------------- ------ Yolanda Meza División Nuevas Tecnologías COPACO S.A. Tel.: 021 226950 ? 021 202878 Fax: 021 219-2287 Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay E-mail: <mailto:ymeza@xxxxxxxxxxxxx> ymeza@xxxxxxxxxxxxx ---------------------------------------------------------------------------- ------ De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: jueves, 09 de agosto de 2012 14:56 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF Vamos por otro archivo. Abri una ventana de sistema y hace lo siguiente: cd c:\greenstone dir /b /s > dir.txt y luego enviame el archivo c:\greenstone\dir.txt Saludos!. Diego Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.prodigioconsultores.com/> Contact me: diegospano diegospano <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK HERE. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2012/8/9 Yolanda Meza <ymeza@xxxxxxxxxxxxx> <http://www.linkedin.com/in/diegospano> Hola Diego: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Adjunto imagen del gli ejecutado en ventana de sistema. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Porfa no me digas que se te acaban las ideas? :?( <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Espero que en la imagen encuentres alguna anormalidad que se pueda solucionar. J <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Saludos, <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> ---------------------------------------------------------------------------- ------ <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> División Nuevas Tecnologías <http://www.linkedin.com/in/diegospano> COPACO S.A. <http://www.linkedin.com/in/diegospano> Tel.: 021 226950 ? 021 202878 <http://www.linkedin.com/in/diegospano> Fax: 021 219-2287 <http://www.linkedin.com/in/diegospano> Teodoro S. Mongelos 2093 - Cód. Postal 1565 ? Asunción - Paraguay <http://www.linkedin.com/in/diegospano> E-mail: ymeza@xxxxxxxxxxxxx <http://www.linkedin.com/in/diegospano> ---------------------------------------------------------------------------- ------ <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: jueves, 09 de agosto de 2012 11:34 <http://www.linkedin.com/in/diegospano> Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Yolanda, <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> si cuando abrís una ventana de sistema y ejecutas "java" te está tomando el de Sun, entonces java no es el problema. Y sinceramente se me están acabando las ideas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Hagamos lo siguiente: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> - abri una ventana de sistema <http://www.linkedin.com/in/diegospano> - ejecuta lo siguiente: <http://www.linkedin.com/in/diegospano> cd c:\greenstone<enter> <http://www.linkedin.com/in/diegospano> setup.bat<enter> <http://www.linkedin.com/in/diegospano> cd gli<enter> <http://www.linkedin.com/in/diegospano> gli -debug <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Esto te va a generar en esta ventana mensajes a medida que el Gli se va iniciando. Una vez que el GLI ya esté disponible, copiamelos y enviamelos. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Saludos!. Diego <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 <http://www.linkedin.com/in/diegospano> Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK HERE. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza <ymeza@xxxxxxxxxxxxx> <http://www.linkedin.com/in/diegospano> Hola Diego: <http://www.linkedin.com/in/diegospano> Disculpa.. creo que no soy muy clara o específica escribiendo. <http://www.linkedin.com/in/diegospano> Esta es la versión de Java que está en el path (Java(TM) SE Runtime Environment (build 1.6.0_31-b05)) <http://www.linkedin.com/in/diegospano> La otra, la que está en System32, era la que te envié anteriormente por confusión cuando me preguntaste la versión de java y donde tengo instalado el Greenstone. Sorry? :s <http://www.linkedin.com/in/diegospano> Entonces, la versión que tengo debo cambiar?? (Java(TM) SE Runtime Environment (build 1.6.0_31-b05)) <http://www.linkedin.com/in/diegospano> Atte, <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: miércoles, 08 de agosto de 2012 12:36 <http://www.linkedin.com/in/diegospano> Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Me parece raro que te esté tomando un Java que está en la carpeta windows\system32. Me parece que no es el java de SUN. Podés descargarlo de aca e instalarlo? <http://www.linkedin.com/in/diegospano> http://java.com/es/download/index.jsp <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Saludos!. Diego <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 <http://www.linkedin.com/in/diegospano> Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK HERE. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza <ymeza@xxxxxxxxxxxxx> <http://www.linkedin.com/in/diegospano> Hola Diego: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Probando en mi PC: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 1- Java está definido en el path de tu máquina?. Si vos abris una ventana de sistema y ejecutás "java", el sistema operativo te encuentra el comando?. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Java está en el path (Java(TM) SE Runtime Environment (build 1.6.0_31-b05)) <http://www.linkedin.com/in/diegospano> Java(TM) Platform SE binary - Versión: 6.0.310.5 (esta es la versión que se encuentra en C:/Windows/System32) <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2- Reemplaza el archivo c:\greenstone\ext\pdf-box\perllib\plugins\PDFConverter.pm con este que te adjunto (primero hace copia del original por las dudas!). Luego cargá el GLI y fijate si el pdfplugin tiene la opción para configurar pdfbox_conversion <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Reemplazando el archivo que enviaste no puedo abrir ninguna colección. ?Error: La Colección en: C:\Greenstone???\gli.col no se pudo abrir.? <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Al insertar el archivo PDFConverter.pm que tenía anteriormente vuelve a funcionar como antes, sigo sin ver las opciones del PDFBox. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Saludos, <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 <http://www.linkedin.com/in/diegospano> Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.linkedin.com/in/diegospano> Contact me: diegospano diegospano <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK HERE. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2012/8/8 Yolanda Meza <ymeza@xxxxxxxxxxxxx> <http://www.linkedin.com/in/diegospano> Hola Diego: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Qué pena que no puedas ver mi pc L <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> En que carpeta tenés instalado GS?. Que versión de Java tenés? <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> En mi PC: <http://www.linkedin.com/in/diegospano> C:\Greenstone <http://www.linkedin.com/in/diegospano> Java(TM) Platform SE binary - Versión: 6.0.310.5 <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> En el Servidor Windows: <http://www.linkedin.com/in/diegospano> F:\Greenstone <http://www.linkedin.com/in/diegospano> Versión de Java: creo que 1.7 (ver imagen adjunta) <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Gracias. J <http://www.linkedin.com/in/diegospano> Atte, <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: miércoles, 08 de agosto de 2012 9:40 <http://www.linkedin.com/in/diegospano> Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Yolanda, seguramente está filtrada la salida por eso no podes conectarte. Bueno, vamos punto por punto de lo que planteabas... <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Estoy teniendo problemas con PDFBox extensión. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Tengo instalado el GS 2.85 en mi PC (Win 7 Professional) y en un servidor Windows y pronto voy a tener que hacerlo en un servidor Linux. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Empecemos con tu pc. En que carpeta tenes instalado GS?. Que versión de Java tenés? <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Cuando entro al GLI, desde mi PC y servidor Windows, en la ventana DOS reconoce el PDFBox pero el PDFPlugin no me muestra las opciones de on/off para el PDFBox. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Cuando creo colecciones con PDF y otros formatos, solo reconoce los archivos de otros formatos (por ejemplo JPG) pero tampoco puedo ver la colección en la interfaz web. En el archivo de la colección no se crea la carpeta index, por lo que tengo que entrar al archivo de la colección y copiar el archivo building para luego cambiarle el nombre a index, entonces sí puedo ver la colección en la web pero solo con los documentos en otros formatos, los documentos con formato PDF no los carga. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Ya he intentado cambiando opciones en el PDFPlugin, así como en los formatos de VList y DocumentText, los índices de búsqueda y los clasificadores de exploración. También he intentado reconstruir la colección manualmente pero no hubo ninguna diferencia. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Además, tengo colecciones de versiones anteriores de Greenstone que no puedo reconstruir porque cuando lo hago no reconoce todos los archivos, por lo que las dejo como están, por el momento. Las colecciones antiguas las puedo ver, pero los archivos pdf solo pueden ser vistos en texto, el link del icono PDF no funciona. Intente reconstruir la colección para cambiar de versión, como me explicaron en la lista en inglés, pero no funcionó (envío adjunto la imagen de éste error así como el build_log y fail.log de una colección de prueba de PDF?s llamada (libros) que no me funciona). <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Espero tu respuesta, muchas gracias nuevamente. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Atentamente, <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> COPACO SA <http://www.linkedin.com/in/diegospano> Paraguay <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> De: greenstone_es-bounce@xxxxxxxxxxxxx [mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano Enviado el: miércoles, 01 de agosto de 2012 15:17 Para: greenstone_es@xxxxxxxxxxxxx Asunto: [greenstone_es] Re: Colecciones PDF <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Hola Yolanda, <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> cuales son los problemas que tenés? <http://www.linkedin.com/in/diegospano> Saludos!. Diego <http://www.linkedin.com/in/diegospano> Diego Spano Director de Proyectos, Prodigio Consultores Tel: (54 11) 5093-5313 <http://www.linkedin.com/in/diegospano> Argentina dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com <http://www.linkedin.com/in/diegospano> Contact me: Descripción: Descripción: Imagen quitada por el remitente. Google Talkdiegospano Descripción: Descripción: Imagen quitada por el remitente. Skypediegospano <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen quitada por el remitente. <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen quitada por el remitente. My QR VCard <http://www.linkedin.com/in/diegospano> Want a signature like mine? CLICK HERE. Descripción: Descripción: Imagen quitada por el remitente. <http://www.linkedin.com/in/diegospano> Descripción: Descripción: Imagen quitada por el remitente. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> 2012/7/11 Yolanda Meza <ymeza@xxxxxxxxxxxxx> <http://www.linkedin.com/in/diegospano> Hola: <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Tengo problemas para crear colecciones PDF. (PDFBox descomprimido agregado al archivo ext de Greenstone2.85) <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Configuración: (Agrego estos datos de configuración por si sea de utilidad, solicitar más datos en caso de necesidad) <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Formato>VList?<td valign=?Top?>[link][icon][/link] </td><td valign=?Top?>[ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]</td> <td valign=?Top?>[highlight]{Or}{[dc.Title],[exp.Title],Untitled}[/highlight]{If }{[ex.Source],<br><i>([ex.Source])</i>}</td>? <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Formato>DocumentText?[Text]? <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> ¿Alguien me podría ayudar a resolver este problema? <http://www.linkedin.com/in/diegospano> Agradezco desde ya. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Yolanda Meza <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> _____ <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> _____ <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> _____ <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. <http://www.linkedin.com/in/diegospano> <http://www.linkedin.com/in/diegospano> _____ <http://www.linkedin.com/in/diegospano> Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. _____ Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. _____ Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. _____ Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. _____ Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas. _____ Se certificó que el correo no contiene virus. Comprobada por AVG - www.avg.es Versión: 2012.0.2180 / Base de datos de virus: 2437/5092 - Fecha de la versión: 25/06/2012 Las Definiciones de virus internas están desactualizadas.
general options (for ConvertBinaryFile): -convert_to <enum> (REQUIRED) Plugin converts to TEXT or HTML or various types of Image (e.g. JPEG, GIF, PNG). Default: auto auto: Automatically select the format converted to. Format chosen depends on input document type, for example Word will automatically be converted to HTML, whereas PowerPoint will be converted to Greenstone's PagedImage format. html: HTML format. text: Plain text format. -keep_original_filename Keep the original filename for the associated file, rather than converting to doc.pdf, doc.doc etc. -title_sub <string> Substitution expression to modify string stored as Title. Used by, for example, PDFPlugin to remove "Page 1", etc from text used as the title. Default: -apply_fribidi Run the "fribidi" Unicode Bidirectional Algorithm program over the converted file (for right-to-left text). -use_strings If set, a simple strings function will be called to extract text if the conversion utility fails. general options (for AutoExtractMetadata): -first <string> Comma separated list of numbers of characters to extract from the start of the text into a set of metadata fields called 'FirstN', where N is the size. For example, the values "3,5,7" will extract the first 3, 5 and 7 characters into metadata fields called "First3", "First5" and "First7". general options (for AcronymExtractor): -extract_acronyms Extract acronyms from within text and set as metadata. -markup_acronyms Add acronym metadata into document text. general options (for KeyphraseExtractor): -extract_keyphrases Extract keyphrases automatically with Kea (default settings). -extract_keyphrases_kea4 Extract keyphrases automatically with Kea 4.0 (default settings). Kea 4.0 is a new version of Kea that has been developed for controlled indexing of documents in the domain of agriculture. -extract_keyphrase_options <string> Options for keyphrase extraction with Kea. For example: mALIWEB - use ALIWEB extraction model; n5 - extract 5 keyphrase;, eGBK - use GBK encoding. Default: general options (for EmailAddressExtractor): -extract_email Extract email addresses as metadata. -new_extract_email general options (for DateExtractor): -extract_historical_years Extract time-period information from historical documents. This is stored as metadata with the document. There is a search interface for this metadata, which you can include in your collection by adding the statement, "format QueryInterface DateSearch" to your collection configuration file. -maximum_year <int> The maximum historical date to be used as metadata (in a Common Era date, such as 1950). Default: 2012 -maximum_century <string> The maximum named century to be extracted as historical metadata (e.g. 14 will extract all references up to the 14th century). Default: -1 -no_bibliography Do not try to block bibliographic dates when extracting historical dates. general options (for GISExtractor): -extract_placenames Extract placenames from within text and set as metadata. Requires GIS extension to Greenstone. -gazetteer <string> Gazetteer to use to extract placenames from within text and set as metadata. Requires GIS extension to Greenstone. -place_list When extracting placements, include list of placenames at start of the document. Requires GIS extension to Greenstone. general options (for BasePlugin): -process_exp <regexp> A perl regular expression to match against filenames. Matching filenames will be processed by this plugin. For example, using '(?i).html?\$' matches all documents ending in .htm or .html (case-insensitive). Default: -no_blocking Don't do any file blocking. Any associated files (e.g. images in a web page) will be added to the collection as documents in their own right. -block_exp <regexp> Files matching this regular expression will be blocked from being passed to any later plugins in the list. Default: -store_original_file Save the original source document as an associated file. Note this is already done for files like PDF, Word etc. This option is only useful for plugins that don't already store a copy of the original file. -associate_ext <string> Causes files with the same root filename as the document being processed by the plugin AND a filename extension from the comma separated list provided by this argument to be associated with the document being processed rather than handled as a separate list. -associate_tail_re <string> A regular expression to match filenames against to find associated files. Used as a more powerful alternative to associate_ext. -OIDtype <enum> The method to use when generating unique identifiers for each document. Default: auto auto: Use OIDtype set in import.pl hash: Hash the contents of the file. Document identifiers will be the same every time the collection is imported. hash_on_ga_xml: Hash the contents of the Greenstone Archive XML file. Document identifiers will be the same every time the collection is imported as long as the metadata does not change. assigned: Use the metadata value given by the OIDmetadata option (preceded by 'D'); if unspecified, for a particular document a hash is used instead. These identifiers should be unique. incremental: Use a simple document count. Significantly faster than "hash", but does not necessarily assign the same identifier to the same document content if the collection is reimported. dirname: Use the parent directory name (preceded by 'J'). There should only be one document per directory, and directory names should be unique. E.g. import/b13as/h15ef/page.html will get an identifier of Jh15ef. -OIDmetadata <metadata> Specifies the metadata element that hold's the document's unique identifier, for use with -OIDtype=assigned. Default: dc.Identifier -no_cover_image Do not look for a prefix.jpg file (where prefix is the same prefix as the file being processed) to associate as a cover image. -filename_encoding <enum> The encoding of the source file filenames. Default: auto auto: Automatically detect the encoding o f the filename. auto-language-analysis: Auto-detect the encoding of the filename by analysing it. auto-filesystem-encoding: Auto-detect the encoding of the filename using filesystem encoding. auto-fl: Uses filesystem encoding then language analysis to detect the filename encoding. auto-lf: Uses language analysis then filesystem encoding to detect the filename encoding. ascii: Plain 7 bit ASCII. This may be a bit faster than using iso_8859_1. Beware of using this when the text may contain characters outside the plain 7 bit ASCII set though (e.g. German or French text containing accents), use iso_8859_1 instead. utf8: Either utf8 or unicode -- automatically detected. unicode: Just unicode. iso_8859_6: Arabic gb: Chinese Simplified (GB) big5: Chinese Traditional (Big5) koi8_r: Cyrillic iso_8859_5: Cyrillic koi8_u: Cyrillic (Ukrainian) dos_437: DOS codepage 437 (US English) dos_850: DOS codepage 850 (Latin 1) dos_852: DOS codepage 852 (Central European) dos_866: DOS codepage 866 (Cyrillic) iso_8859_7: Greek iso_8859_8: Hebrew iscii_de: ISCII Devanagari euc_jp: Japanese (EUC) shift_jis: Japanese (Shift-JIS) korean: Korean (Unified Hangul Code - i.e . a superset of EUC-KR) iso_8859_1: Latin1 (western languages) iso_8859_15: Latin15 (revised western) iso_8859_2: Latin2 (central and eastern european languages) iso_8859_3: Latin3 iso_8859_4: Latin4 iso_8859_9: Turkish windows_1250: Windows codepage 1250 (WinLatin2) windows_1251: Windows codepage 1251 (WinCyrillic) windows_1252: Windows codepage 1252 (WinLatin1) windows_1253: Windows codepage 1253 (WinGreek) windows_1254: Windows codepage 1254 (WinTurkish) windows_1255: Windows codepage 1255 (WinHebrew) windows_1256: Windows codepage 1256 (WinArabic) windows_1257: Windows codepage 1257 (WinBaltic) windows_1258: Windows codepage 1258 (Vietnamese) windows_874: Windows codepage 874 (Thai) -smart_block SUPERSEDED. Block files in a smarter way than just lo oking at filenames. -file_rename_method <enum> The method to be used in renaming the copy of the imported file and associated files. Default: url url: Use url encoding in renaming importe d files and associated files. base64: Use base64 encoding in renaming imported files and associated files. none: Don't rename imported files and associated files. c:\Greenstone>
general options (for ConvertBinaryFile): -convert_to <enum> (REQUIRED) Plugin converts to TEXT or HTML or various types of Image (e.g. JPEG, GIF, PNG). Default: auto auto: Automatically select the format converted to. Format chosen depends on input document type, for example Word will automatically be converted to HTML, whereas PowerPoint will be converted to Greenstone's PagedImage format. html: HTML format. text: Plain text format. -keep_original_filename Keep the original filename for the associated file, rather than converting to doc.pdf, doc.doc etc. -title_sub <string> Substitution expression to modify string stored as Title. Used by, for example, PDFPlugin to remove "Page 1", etc from text used as the title. Default: -apply_fribidi Run the "fribidi" Unicode Bidirectional Algorithm program over the converted file (for right-to-left text). -use_strings If set, a simple strings function will be called to extract text if the conversion utility fails. general options (for AutoExtractMetadata): -first <string> Comma separated list of numbers of characters to extract from the start of the text into a set of metadata fields called 'FirstN', where N is the size. For example, the values "3,5,7" will extract the first 3, 5 and 7 characters into metadata fields called "First3", "First5" and "First7". general options (for AcronymExtractor): -extract_acronyms Extract acronyms from within text and set as metadata. -markup_acronyms Add acronym metadata into document text. general options (for KeyphraseExtractor): -extract_keyphrases Extract keyphrases automatically with Kea (default settings). -extract_keyphrases_kea4 Extract keyphrases automatically with Kea 4.0 (default settings). Kea 4.0 is a new version of Kea that has been developed for controlled indexing of documents in the domain of agriculture. -extract_keyphrase_options <string> Options for keyphrase extraction with Kea. For example: mALIWEB - use ALIWEB extraction model; n5 - extract 5 keyphrase;, eGBK - use GBK encoding. Default: general options (for EmailAddressExtractor): -extract_email Extract email addresses as metadata. -new_extract_email general options (for DateExtractor): -extract_historical_years Extract time-period information from historical documents. This is stored as metadata with the document. There is a search interface for this metadata, which you can include in your collection by adding the statement, "format QueryInterface DateSearch" to your collection configuration file. -maximum_year <int> The maximum historical date to be used as metadata (in a Common Era date, such as 1950). Default: 2012 -maximum_century <string> The maximum named century to be extracted as historical metadata (e.g. 14 will extract all references up to the 14th century). Default: -1 -no_bibliography Do not try to block bibliographic dates when extracting historical dates. general options (for GISExtractor): -extract_placenames Extract placenames from within text and set as metadata. Requires GIS extension to Greenstone. -gazetteer <string> Gazetteer to use to extract placenames from within text and set as metadata. Requires GIS extension to Greenstone. -place_list When extracting placements, include list of placenames at start of the document. Requires GIS extension to Greenstone. general options (for BasePlugin): -process_exp <regexp> A perl regular expression to match against filenames. Matching filenames will be processed by this plugin. For example, using '(?i).html?\$' matches all documents ending in .htm or .html (case-insensitive). Default: -no_blocking Don't do any file blocking. Any associated files (e.g. images in a web page) will be added to the collection as documents in their own right. -block_exp <regexp> Files matching this regular expression will be blocked from being passed to any later plugins in the list. Default: -store_original_file Save the original source document as an associated file. Note this is already done for files like PDF, Word etc. This option is only useful for plugins that don't already store a copy of the original file. -associate_ext <string> Causes files with the same root filename as the document being processed by the plugin AND a filename extension from the comma separated list provided by this argument to be associated with the document being processed rather than handled as a separate list. -associate_tail_re <string> A regular expression to match filenames against to find associated files. Used as a more powerful alternative to associate_ext. -OIDtype <enum> The method to use when generating unique identifiers for each document. Default: auto auto: Use OIDtype set in import.pl hash: Hash the contents of the file. Document identifiers will be the same every time the collection is imported. hash_on_ga_xml: Hash the contents of the Greenstone Archive XML file. Document identifiers will be the same every time the collection is imported as long as the metadata does not change. assigned: Use the metadata value given by the OIDmetadata option (preceded by 'D'); if unspecified, for a particular document a hash is used instead. These identifiers should be unique. incremental: Use a simple document count. Significantly faster than "hash", but does not necessarily assign the same identifier to the same document content if the collection is reimported. dirname: Use the parent directory name (preceded by 'J'). There should only be one document per directory, and directory names should be unique. E.g. import/b13as/h15ef/page.html will get an identifier of Jh15ef. -OIDmetadata <metadata> Specifies the metadata element that hold's the document's unique identifier, for use with -OIDtype=assigned. Default: dc.Identifier -no_cover_image Do not look for a prefix.jpg file (where prefix is the same prefix as the file being processed) to associate as a cover image. -filename_encoding <enum> The encoding of the source file filenames. Default: auto auto: Automatically detect the encoding o f the filename. auto-language-analysis: Auto-detect the encoding of the filename by analysing it. auto-filesystem-encoding: Auto-detect the encoding of the filename using filesystem encoding. auto-fl: Uses filesystem encoding then language analysis to detect the filename encoding. auto-lf: Uses language analysis then filesystem encoding to detect the filename encoding. ascii: Plain 7 bit ASCII. This may be a bit faster than using iso_8859_1. Beware of using this when the text may contain characters outside the plain 7 bit ASCII set though (e.g. German or French text containing accents), use iso_8859_1 instead. utf8: Either utf8 or unicode -- automatically detected. unicode: Just unicode. iso_8859_6: Arabic gb: Chinese Simplified (GB) big5: Chinese Traditional (Big5) koi8_r: Cyrillic iso_8859_5: Cyrillic koi8_u: Cyrillic (Ukrainian) dos_437: DOS codepage 437 (US English) dos_850: DOS codepage 850 (Latin 1) dos_852: DOS codepage 852 (Central European) dos_866: DOS codepage 866 (Cyrillic) iso_8859_7: Greek iso_8859_8: Hebrew iscii_de: ISCII Devanagari euc_jp: Japanese (EUC) shift_jis: Japanese (Shift-JIS) korean: Korean (Unified Hangul Code - i.e . a superset of EUC-KR) iso_8859_1: Latin1 (western languages) iso_8859_15: Latin15 (revised western) iso_8859_2: Latin2 (central and eastern european languages) iso_8859_3: Latin3 iso_8859_4: Latin4 iso_8859_9: Turkish windows_1250: Windows codepage 1250 (WinLatin2) windows_1251: Windows codepage 1251 (WinCyrillic) windows_1252: Windows codepage 1252 (WinLatin1) windows_1253: Windows codepage 1253 (WinGreek) windows_1254: Windows codepage 1254 (WinTurkish) windows_1255: Windows codepage 1255 (WinHebrew) windows_1256: Windows codepage 1256 (WinArabic) windows_1257: Windows codepage 1257 (WinBaltic) windows_1258: Windows codepage 1258 (Vietnamese) windows_874: Windows codepage 874 (Thai) -smart_block SUPERSEDED. Block files in a smarter way than just lo oking at filenames. -file_rename_method <enum> The method to be used in renaming the copy of the imported file and associated files. Default: url url: Use url encoding in renaming importe d files and associated files. base64: Use base64 encoding in renaming imported files and associated files. none: Don't rename imported files and associated files. c:\Greenstone>