[greenstone_es] Re: De PDF a HTML

  • From: "Julio Somacal" <julio@xxxxxxxxxxxxxxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Tue, 17 Sep 2013 19:46:31 -0300

Erick,

Luego de pasar por tu experiencia fallida con PDFBox, con Greenstone 2.85 y 
Java 7 encontré en la Greenstone wiki esta info con la cual apareció 
la sección autoLoadConverters
PDFBox
  a.. The PDF Box extension provides support for conversion of PDF documents to 
text. It supports the latest PDF versions (unlike Greenstone's standard 
pdftohtml program), so is useful for collections with new PDF documents. 
    a.. Download the extension from here, which is available in tar.gz and zip 
formats, and unzip into Greenstone's ext folder. The PDF Box extension does not 
require additional software to be installed. Note, if you are using Java 1.7 
then please follow instructions here. 
    b.. If you are using the latest version of the PDF Box extension, open up 
your Greenstone's perllib\util.pm file in a text editor and add the following 
code near the very end but before the terminating line which says "1;": 
# returns the path to the java command in the JRE included with GS (if any),
# quoted to safeguard any spaces in this path, otherwise a simple java
# command is returned which assumes and will try for a system java.
sub get_java_command {
    my $java = "java";
    if(defined $ENV{'GSDLHOME'}) { # should be, as this script would be 
launched from the cmd line 
                                   # after running setup.bat or from GLI which 
also runs setup.bat
        my $java_bin = 
&util::filename_cat($ENV{'GSDLHOME'},"packages","jre","bin");
        if(-d $java_bin) {
            $java = &util::filename_cat($java_bin,"java");
            $java = "\"".$java."\""; # quoted to preserve spaces in path
        }
    }
    return $java;
}
Saludos.

Julio Somacal
Biblioteca Central UNLPam

----- Original Message ----- 
  From: Erick Manuel Tardencilla Marenco 
  To: greenstone_es@xxxxxxxxxxxxx 
  Sent: Tuesday, September 17, 2013 5:51 PM
  Subject: [greenstone_es] Re: De PDF a HTML


  Greenstone 2.85, Java 7 update 21 y Windows 7



  Erick Manuel Tardencilla Marenco




------------------------------------------------------------------------------
  From: diegospano@xxxxxxxxx
  Date: Tue, 17 Sep 2013 14:54:43 -0300
  Subject: [greenstone_es] Re: De PDF a HTML
  To: greenstone_es@xxxxxxxxxxxxx


  Qué version de GS, Windows y Java estás usando?



  Diego Spano Director de Proyectos, Prodigio Consultores
  Tel: (54 11) 5093-5313 - Argentina

  dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

  Contact me:  diegospano  diegospano

   
  Want a signature like mine? CLICK HERE.    



  2013/9/17 Erick Manuel Tardencilla Marenco <ermatama@xxxxxxxxxxx>

    Gracias Diego por contestar. Mira de la imagen que has puesto. La opcion 
"AutoLoadConverters" no me aparece en la ventana a mi, te describo las 
siguientes categorias que me salen en la ventana de configuracion de PDF:
    PDFPlugin, ConvertBinaryFile, AutoExtractMetadata, AcronymExtractor, 
KeyPhraseExtractor, EmailAddresExtractor, DateExtractor, GISExtractor, 
BasePlugin


    Bueno como antes habia dicho, descomprimi el archivo de PDFBox en la 
carpeta Ext de Greenstone, que podria ser el problema?



    Erick Manuel Tardencilla Marenco




----------------------------------------------------------------------------
    From: diegospano@xxxxxxxxx
    Date: Tue, 17 Sep 2013 13:16:59 -0300

    Subject: [greenstone_es] Re: De PDF a HTML

    To: greenstone_es@xxxxxxxxxxxxx



    Es una opción más del plugin en la seccion AutoLoadConverters








    Diego Spano Director de Proyectos, Prodigio Consultores
    Tel: (54 11) 5093-5313 - Argentina
    dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.p


    rodigioconsultores.com

    Contact me:  diegospano  diegospano

     
    Want a signature like mine? CLICK HERE.    



    2013/9/17 Erick Manuel Tardencilla Marenco <ermatama@xxxxxxxxxxx>

      Hola a todos. He seguido los pasos de Diego para probar el PDFBox. Lo he 
descargado y lo descomprimi en la carpeta "ext" de Greenstone. Pero sucede que 
cuando quiero configurar el PDFPluging en la opcion "Convert to" NO APARECE la 
opcion de "PDFBox".


      Estoy haciendo algo mal???, alguien me puede describir como usar el PDFBox


      Gracias



      Erick Manuel Tardencilla Marenco




--------------------------------------------------------------------------
      From: julio@xxxxxxxxxxxxxxxxxxxxxxxx
      To: greenstone_es@xxxxxxxxxxxxx

      Subject: [greenstone_es] Re: De PDF a HTML

      Date: Tue, 17 Sep 2013 09:49:11 -0300



      Gracias Diego, estoy usando G 2.85 asi que probaremos PDFBox.

      Saludos.
      Julio Somacal
      Biblioteca Central UNLPam
        ----- Original Message ----- 
        From: Diego Spano 
        To: Lista (en español) Greenstone 
        Sent: Monday, September 16, 2013 10:27 PM
        Subject: [greenstone_es] Re: De PDF a HTML


        Julio, Greenstone utiliza software de terceros para la conversión de 
formatos, en este caso, para convertir de PDF a HTML usa el WvWare. Los 
archivos PDF en realidad son bastante complicados para exportar. Hacé alguna 
vez una prueba de convertir un PDF desde el Adobe Professional a Word o HTML. 
Simplemente es desastrozo en aquellos casos en los que no es un simple PDF con 
parrafos a una columna. Cuando agregas columnas e imágenes todo se empieza a 
mezclar.

        Sin embargo, desde hace un par de versiones Greenstone incorporó el 
PDFBox que es una herramienta adicional para convertir. Yo hice una prueba y el 
resultado es este:

        
*****************************************************************************************

        13Facultad de Ciencias HumanasUNLPam
        ISSN 2313-934X
        (enero - junio 2013)


        Vol. XVI, Nº 1
        pp. 22-28


        Introducción 


        El curriculum escolar general está diseñado para equipar a los 
estudiantes con cierto conocimiento sobre el mundo en general, 
        sobre la historia y la geografía, sobre la política en sus propios 
países 
        y en otros, sobre lo que está sucediendo en el ámbito de las ciencias, 
        sobre las artes y la literatura, entre otros temas. Además, esperamos 
        que la amplitud del conocimiento no sea una mera acumulación 
        de hechos, sino que a su vez implique principios de ordenamiento 
        conceptual que aseguren a los estudiantes desarrollar cierta com-
        prensión general. También esperamos que la persona educada haya 
        desarrollado hábitos de reflexión crítica acerca de lo que se sabe.


        Inevitablemente, como hay simplemente demasiado para cubrir 
        en el currículo –el cual sirve como una especie de gran enciclope-
        dia de conocimiento humano en líneas generales– los estudiantes 
        tienden, en el mejor de los casos, a terminar la escuela con una am-
        plitud de conocimiento un tanto superficial. Por lo general, en es-
        pecial para los estudiantes más exitosos, las escuelas brindan opor-
        tunidades para especializarse en cierta área de estudio. Esto con 
        frecuencia constituye una introducción un poquito más profunda 
        hacia esa área de especialización, la cual, en comparación con el 
        conocimiento genuino, sólo puede considerarse un poquito menos 
        superficial que lo que se aprende en el resto del curriculum. 


        Adaptándose a nuevas formas de enseñanza 
        dentro del programa “Aprender en Profundidad”1


        Kieran EGAN y Gillian JUDSON*


        (*) Faculty of Education
        Simon Fraser University


        Burnaby, B.C. Canada V5A 1S6
        egan@xxxxxx
        gcj@xxxxxx


        Resumen


        Por mucho tiempo se sostuvo que estar 
        educado implica cumplir con dos crite­
        rios: en primer lugar, uno debe conocer 
        muchas cosas acerca del mundo y, en se­
        gundo lugar, uno debe conocer algo en 
        profundidad significativa. Para alcanzar el 
        criterio de profundidad se han propuesto 
        una cantidad de posibilidades, ninguna 
        de las cuales resultó clara o claramente 
        exitosa. Una innovación curricular desa­
        rrollada en Canadá y llamada “Aprender 
        en Profundidad” constituye un progra­
        ma simple y practicable para asegurar a 
        todos los estudiantes un aprendizaje en 
        profundidad y merece, en ese sentido, 
        que se realicen implementaciones experi­
        mentales más amplias. Asimismo, requie­
        re nuevas formas de enseñanza.


        Palabras claves: aprendizaje, profundi­
        dad, enseñanza, curriculum.


        Adapting to new forms of teaching in the 
        “Learning in Depth” program


        Abstract
        It has long been argued that being educat­
        ed entails satisfying two criteria: first, one 
        must know many things about the world 
        and, second, that one must know some­
        thing in significant depth. There have 
        been a number of proposals for attaining 
        the depth criterion, none of them either 
        clear or clearly successful. A curriculum 
        innovation from Canada called “Learn­
        ing in Depth” is a simple and practicable 
        program for ensuring depth learning for 
        all students, and it seems to merit wider 
        experimental implementations. It also re­
        quires somewhat new forms of teaching.

        Key Words: learning, depth, teaching, 
        curriculum.

        Detalle obra “Tierra árida”
        Ricardo Arcuri

        http://www.fchst.unlpam.edu.ar/ojs/index.php/praxis/
        Vol. XVII, Nº 1, 13 3
        
***************************************************************************



        El resultado fue mucho mejor. Descargá la extensión llamada PDFBox. El 
link es: 


        
http://trac.greenstone.org/export/26462/gs2-extensions/pdf-box/trunk/pdf-box-java.zip


        Simplemente descomprimi el archivo en la carpeta greenstone/ext y luego 
configurá el plugin PDFPlugin con la opción "-pdfbox_conversion".


        Estás usando GS 2.85?. Si asi no fuera, para que la extensión funciones 
tenés que usar 2.85, el cual podés descargar desde 
http://www.greenstone.org/download.


        Saludos


        Diego Spano Director de Proyectos, Prodigio Consultores
        Tel: (54 11) 5093-5313 


        Argentina
        dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

        Contact me:  diegospano  diegospano

        Designed with WiseStamp - Get yours 







        2013/9/16 Julio Somacal <julio@xxxxxxxxxxxxxxxxxxxxxxxx>

          Hola Estimados Amigos de Greenstone:

          El problema en que me encuentro es con la conversión automática de 
PDF a HTML que hace greenstone, estoy utilizando PDFPlugin.
          1.
          El html final que se genera cuando hay texto a dos columnas en el 
original (en el pdf adjunto hay una muestra) se intercalan  las filas del texto 
de las 2 columnas (más abajo la muestra).

          2. Cuando el texto es en un cuerpo la conversión es "tal cual" al 
original del pdf. Lo cuál es correcto. Mi pregunta es si hay algún modo " 
configurable en greenstone" para que al momento de conversión automática 
ampliar el margen derecho (que sea mas expandido). (Abajo una muestra de como 
queda con el texto en un cuerpo)

          Desde ya muchas gracias por el aporte.
          Un Abrazo

          Julio Somacal
          Biblioteca Central UNLPam


          Adaptándose a nuevas formas de enseñanza 
          dentro del programa “Aprender en Profundidad”1
          Kieran EGAN y Gillian JUDSON*
          Resumen
          Adapting to new forms of teaching in the 
          “Learning in Depth” program
          Por mucho tiempo se sostuvo que estar 
          educado implica cumplir con dos crite­
          Abstract
          rios: en primer lugar, uno debe conocer 
          It has long been argued that being educat­
          muchas cosas acerca del mundo y, en se­
          ed entails satisfying two criteria: first, one 
          gundo lugar, uno debe conocer algo en 
          must know many things about the world 
          profundidad significativa. Para alcanzar el 
          and, second, that one must know some­
          criterio de profundidad se han propuesto 
          thing in significant depth. There have 
          una cantidad de posibilidades, ninguna 
          been a number of proposals for attaining 
          de las cuales resultó clara o claramente 
          the depth criterion, none of them either 
          exitosa. Una innovación curricular desa­
          clear or clearly successful. A curriculum 
          rrollada en Canadá y llamada “Aprender 
          innovation from Canada called “Learn­
          en Profundidad” constituye un progra­
          ing in Depth” is a simple and practicable 
          ma simple y practicable para asegurar a 
          program for ensuring depth learning for 
          todos los estudiantes un aprendizaje en 
          all students, and it seems to merit wider 
          profundidad y merece, en ese sentido, 
          experimental implementations. It also re­
          que se realicen implementaciones experi­
          quires somewhat new forms of teaching.
          mentales más amplias. Asimismo, requie­
          re nuevas formas de enseñanza.
          Palabras claves: aprendizaje, profundi­
          Key Words: learning, depth, teaching, 
          dad, enseñanza, curriculum.
          curriculum.
          Detalle obra “Tierra árida”
          Ricardo Arcuri
          Introducción 
          El curriculum escolar general está diseñado para equipar a los 
          estudiantes con cierto conocimiento sobre el mundo en general, 
          sobre la historia y la geografía, sobre la política en sus propios 
países 
          y en otros, sobre lo que está sucediendo en el ámbito de las 
ciencias, 
          sobre las artes y la literatura, entre otros temas. Además, esperamos 
          que la amplitud del conocimiento no sea una mera acumulación 
          de hechos, sino que a su vez implique principios de ordenamiento 
          conceptual que aseguren a los estudiantes desarrollar cierta com-
          prensión general. También esperamos que la persona educada haya 
          desarrollado hábitos de reflexión crítica acerca de lo que se sabe.
          Inevitablemente, como hay simplemente demasiado para cubrir 
          en el currículo –el cual sirve como una especie de gran enciclope-
          dia de conocimiento humano en líneas generales– los estudiantes 
          tienden, en el mejor de los casos, a terminar la escuela con una am-
          plitud de conocimiento un tanto superficial. Por lo general, en es-
          pecial para los estudiantes más exitosos, las escuelas brindan opor-
          (*) Faculty of Education
          tunidades para especializarse en cierta área de estudio. Esto con 
          Simon Fraser University
          Burnaby, B.C. Canada V5A 1S6
          frecuencia constituye una introducción un poquito más profunda 
          egan@xxxxxx
          hacia esa área de especialización, la cual, en comparación con el 
          gcj@xxxxxx
          conocimiento genuino, sólo puede considerarse un poquito menos 
          superficial que lo que se aprende en el resto del curriculum. 
          ISSN 2313-934X
          Facultad de Ciencias Humanas
          http://www
          Vol. XVI, Nº 1
          .fchst.unlpam.edu.ar/ojs/index.php/praxis/
          13
          (enero - junio 2013)
          UNLPam
          V
          pp. 22-28
          ol. XVII, Nº 1, pp. 13-23






Other related posts: