[greenstone_es] Re: De PDF a HTML

  • From: Erick Manuel Tardencilla Marenco <ermatama@xxxxxxxxxxx>
  • To: "greenstone_es@xxxxxxxxxxxxx" <greenstone_es@xxxxxxxxxxxxx>
  • Date: Wed, 18 Sep 2013 12:01:43 +0000

Gracias Julio, Intentare seguir esas instrucciones y ver que pasa, estamos en 
contacto :)


Erick Manuel Tardencilla Marenco

From: julio@xxxxxxxxxxxxxxxxxxxxxxxx
To: greenstone_es@xxxxxxxxxxxxx
Subject: [greenstone_es] Re: De PDF a HTML
Date: Tue, 17 Sep 2013 19:46:31 -0300








Erick,
 
Luego de pasar por tu experiencia fallida con 
PDFBox, con Greenstone 2.85 y Java 7 encontré en la Greenstone wiki esta info 
con la cual apareció 
la sección autoLoadConverters

PDFBox

  The PDF Box extension provides support for conversion of PDF documents to 
  text. It supports the latest PDF versions (unlike Greenstone's standard 
  pdftohtml program), so is useful for collections with new PDF documents. 
  
    Download the extension from here, which is available in tar.gz and zip 
formats, 
    and unzip into Greenstone's ext folder. The PDF Box extension does 
    not require additional software to be installed. Note, if you are using 
Java 
    1.7 then please follow instructions here. 
    
    If you are using the latest version of the PDF Box extension, open up your 
    Greenstone's perllib\util.pm file in a text editor and add the following 
    code near the very end but before the terminating line which says 
    "1;": # returns the path to the java command in the JRE included with GS 
(if any),
# quoted to safeguard any spaces in this path, otherwise a simple java
# command is returned which assumes and will try for a system java.
sub get_java_command {
    my $java = "java";
    if(defined $ENV{'GSDLHOME'}) { # should be, as this script would be 
launched from the cmd line 
                                   # after running setup.bat or from GLI which 
also runs setup.bat
        my $java_bin = 
&util::filename_cat($ENV{'GSDLHOME'},"packages","jre","bin");
        if(-d $java_bin) {
            $java = &util::filename_cat($java_bin,"java");
            $java = "\"".$java."\""; # quoted to preserve spaces in path
        }
    }
    return $java;
}

Saludos.
 
Julio Somacal
Biblioteca Central UNLPam
 
----- Original Message ----- 

  From: 
  Erick Manuel 
  Tardencilla Marenco 
  To: greenstone_es@xxxxxxxxxxxxx 
  
  Sent: Tuesday, September 17, 2013 5:51 
  PM
  Subject: [greenstone_es] Re: De PDF a 
  HTML
  

  Greenstone 2.85, 
  Java 7 update 21 y Windows 7


  Erick Manuel 
  Tardencilla Marenco


  
  
  From: diegospano@xxxxxxxxx
Date: 
  Tue, 17 Sep 2013 14:54:43 -0300
Subject: [greenstone_es] Re: De PDF a 
  HTML
To: greenstone_es@xxxxxxxxxxxxx


  Qué version de GS, Windows y Java estás usando?



  
  
  
  
  Diego Spano Director de 
  Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313 - Argentina

  dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.com

  Contact me: 
   diegospano  diegospano

   
  
  Want a signature like mine? 
  CLICK HERE.    
  
  


  2013/9/17 Erick Manuel Tardencilla Marenco <ermatama@xxxxxxxxxxx>

  
    
    Gracias Diego 
    por contestar. Mira de la imagen que has puesto. La opcion 
    "AutoLoadConverters" no me aparece en la ventana a mi, te describo las 
    siguientes categorias que me salen en la ventana de configuracion de 
    PDF:
    PDFPlugin, 
    ConvertBinaryFile, AutoExtractMetadata, AcronymExtractor, 
    KeyPhraseExtractor, EmailAddresExtractor, DateExtractor, GISExtractor, 
    BasePlugin
    

    Bueno como antes habia 
    dicho, descomprimi el archivo de PDFBox en la carpeta Ext de Greenstone, 
que 
    podria ser el problema?



    Erick Manuel 
    Tardencilla Marenco


    
    
    From: diegospano@xxxxxxxxx
Date: Tue, 17 Sep 2013 13:16:59 
    -0300
    
Subject: [greenstone_es] Re: De PDF a HTML
To: 
    greenstone_es@xxxxxxxxxxxxx
    
    


    
    Es una opción más del plugin en la seccion AutoLoadConverters
    

    




    
    
    
    Diego Spano 
    Director de Proyectos, Prodigio Consultores
Tel: (54 11) 
    5093-5313 - Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.p


rodigioconsultores.com

    Contact me: 
     diegospano  diegospano

     
    Want a signature like 
    mine? CLICK HERE.    
    
    


    2013/9/17 Erick Manuel Tardencilla Marenco <ermatama@xxxxxxxxxxx>

    
      
      Hola a todos. 
      He seguido los pasos de Diego para probar el PDFBox. Lo he descargado y 
lo 
      descomprimi en la carpeta "ext" de Greenstone. Pero sucede que cuando 
      quiero configurar el PDFPluging en la opcion "Convert to" NO APARECE la 
      opcion de "PDFBox".
      

      Estoy haciendo algo 
      mal???, alguien me puede describir como usar el PDFBox
      

      Gracias



      Erick Manuel 
      Tardencilla Marenco


      
      
      From: julio@xxxxxxxxxxxxxxxxxxxxxxxx
To: greenstone_es@xxxxxxxxxxxxx
      
Subject: [greenstone_es] Re: De PDF a HTML
Date: Tue, 17 
      Sep 2013 09:49:11 -0300
      
      


      Gracias Diego, estoy usando G 2.85 asi que 
      probaremos PDFBox.
       
      Saludos.
      Julio Somacal
      Biblioteca Central UNLPam
      
        ----- Original Message ----- 
        From: Diego Spano 
        To: Lista (en 
        español) Greenstone 
        Sent: Monday, September 16, 2013 
        10:27 PM
        Subject: [greenstone_es] Re: De PDF 
        a HTML
        

        Julio, Greenstone utiliza software de terceros para la 
        conversión de formatos, en este caso, para convertir de PDF a HTML usa 
        el WvWare. Los archivos PDF en realidad son bastante complicados para 
        exportar. Hacé alguna vez una prueba de convertir un PDF desde el Adobe 
        Professional a Word o HTML. Simplemente es desastrozo en aquellos casos 
        en los que no es un simple PDF con parrafos a una columna. Cuando 
        agregas columnas e imágenes todo se empieza a mezclar.

Sin 
        embargo, desde hace un par de versiones Greenstone incorporó el PDFBox 
        que es una herramienta adicional para convertir. Yo hice una prueba y 
el 
        resultado es 
        este:

*****************************************************************************************

13Facultad 
        de Ciencias HumanasUNLPam
ISSN 2313-934X
(enero - junio 
        2013)


Vol. XVI, Nº 1
pp. 22-28


Introducción 
        


El curriculum escolar general está diseñado 
        para equipar a los estudiantes con cierto conocimiento sobre el mundo 
en 
        general, 
sobre la historia y la geografía, sobre la política en sus 
        propios países 
y en otros, sobre lo que está sucediendo en el ámbito 
        de las ciencias, 
sobre las artes y la literatura, entre otros temas. 
        Además, esperamos 
que la amplitud del conocimiento no sea una mera 
        acumulación 
de hechos, sino que a su vez implique principios de 
        ordenamiento 
conceptual que aseguren a los estudiantes desarrollar 
        cierta com-
prensión general. También esperamos que la persona 
        educada haya 
desarrollado hábitos de reflexión crítica acerca de lo 
        que se sabe.


Inevitablemente, como hay simplemente demasiado 
        para cubrir 
en el currículo –el cual sirve como una especie de gran 
        enciclope-
dia de conocimiento humano en líneas generales– los 
        estudiantes 
tienden, en el mejor de los casos, a terminar la escuela 
        con una am-
plitud de conocimiento un tanto superficial. Por lo 
        general, en es-
pecial para los estudiantes más exitosos, las 
        escuelas brindan opor-
tunidades para especializarse en cierta área 
        de estudio. Esto con 
frecuencia constituye una introducción un 
        poquito más profunda 
hacia esa área de especialización, la cual, en 
        comparación con el 
conocimiento genuino, sólo puede considerarse un 
        poquito menos 
superficial que lo que se aprende en el resto del 
        curriculum. 


Adaptándose a nuevas formas de 
        enseñanza 
dentro del programa “Aprender en 
        Profundidad”1


Kieran EGAN y Gillian JUDSON*


(*) 
        Faculty of Education
Simon Fraser University


Burnaby, B.C. 
        Canada V5A 1S6
egan@xxxxxx
gcj@xxxxxx


Resumen


Por mucho 
        tiempo se sostuvo que estar 
educado implica cumplir con dos 
        crite­
rios: en primer lugar, uno debe conocer 
muchas cosas 
        acerca del mundo y, en se­
gundo lugar, uno debe conocer algo en 
        
profundidad significativa. Para alcanzar el 
criterio de 
        profundidad se han propuesto 
una cantidad de posibilidades, ninguna 
        
de las cuales resultó clara o claramente 
exitosa. Una innovación 
        curricular desa­
rrollada en Canadá y llamada “Aprender 
en 
        Profundidad” constituye un progra­
ma simple y practicable para 
        asegurar a 
todos los estudiantes un aprendizaje en 
profundidad y 
        merece, en ese sentido, 
que se realicen implementaciones 
        experi­
mentales más amplias. Asimismo, requie­
re nuevas 
        formas de enseñanza.


Palabras claves: aprendizaje, 
        profundi­
dad, enseñanza, 
        curriculum.


Adapting to new forms of teaching in 
        the 
“Learning in Depth” program


Abstract
It has long 
        been argued that being educat­
ed entails satisfying two 
        criteria: first, one 
must know many things about the world 
and, 
        second, that one must know some­
thing in significant depth. 
        There have 
been a number of proposals for attaining 
the depth 
        criterion, none of them either 
clear or clearly successful. A 
        curriculum 
innovation from Canada called 
        “Learn­
ing in Depth” is a simple and practicable 
program for 
        ensuring depth learning for 
all students, and it seems to merit 
        wider 
experimental implementations. It also re­
quires 
        somewhat new forms of teaching.

Key Words: learning, depth, 
        teaching, 
curriculum.

Detalle obra “Tierra 
        árida”
Ricardo Arcuri

http://www.fchst.unlpam.edu.ar/ojs/index.php/praxis/
Vol. 
        XVII, Nº 1, 13 
        3
***************************************************************************

        

        El resultado fue mucho mejor. Descargá la extensión llamada 
        PDFBox. El link es: 
        

        
http://trac.greenstone.org/export/26462/gs2-extensions/pdf-box/trunk/pdf-box-java.zip

        Simplemente descomprimi el archivo en la carpeta greenstone/ext y 
        luego configurá el plugin PDFPlugin con la opción 
        "-pdfbox_conversion".
        

        
        Estás 
        usando GS 2.85?. Si asi no fuera, para que la extensión funciones tenés 
        que usar 2.85, el cual podés descargar desde 
http://www.greenstone.org/download.
        

        Saludos


        
        
        
        
        Diego 
        Spano Director de Proyectos, Prodigio 
        Consultores
Tel: 
        (54 11) 5093-5313 
        

        Argentina
dspano@xxxxxxxxxxxxxxxxxxxxxxx | www.prodigioconsultores.comContact me:  
diegospano  diegospano

        Designed with WiseStamp - 
        Get 
        yours 



        
        
        


        2013/9/16 Julio Somacal <julio@xxxxxxxxxxxxxxxxxxxxxxxx>

        
          
          Hola Estimados Amigos de Greenstone:
           
          El problema en que me encuentro es con la conversión 
          automática de PDF a HTML que hace greenstone, estoy 
          utilizando PDFPlugin.
          1.
          El html final que se genera cuando hay texto a dos columnas en el 
          original (en el pdf adjunto hay una muestra) se intercalan  
          las filas del texto de las 2 columnas (más abajo la 
          muestra).
           
          2. Cuando el texto es en un cuerpo 
          la conversión es "tal cual" al original del pdf. Lo cuál es 
          correcto. Mi pregunta es si hay algún modo " configurable en 
          greenstone" para que al momento de conversión 
          automática ampliar el margen derecho (que sea mas expandido). 
          (Abajo una muestra de como queda con el texto en un 
          cuerpo)
           
          Desde ya muchas gracias por el 
          aporte.
          Un Abrazo
           
          Julio Somacal
          Biblioteca Central UNLPam
           
           
          Adaptándose a nuevas formas de enseñanza 
dentro del 
          programa “Aprender en Profundidad”1
Kieran EGAN y Gillian 
          JUDSON*
Resumen
Adapting to new forms of teaching in 
          the 
“Learning in Depth” program
Por mucho tiempo se sostuvo 
          que estar 
educado implica cumplir con dos 
          crite­
Abstract
rios: en primer lugar, uno debe 
          conocer 
It has long been argued that being educat­
muchas 
          cosas acerca del mundo y, en se­
ed entails satisfying two 
          criteria: first, one 
gundo lugar, uno debe conocer algo en 
          
must know many things about the world 
profundidad 
          significativa. Para alcanzar el 
and, second, that one must know 
          some­
criterio de profundidad se han propuesto 
thing in 
          significant depth. There have 
una cantidad de posibilidades, 
          ninguna 
been a number of proposals for attaining 
de las cuales 
          resultó clara o claramente 
the depth criterion, none of them 
          either 
exitosa. Una innovación curricular desa­
clear or 
          clearly successful. A curriculum 
rrollada en Canadá y llamada 
          “Aprender 
innovation from Canada called “Learn­
en 
          Profundidad” constituye un progra­
ing in Depth” is a simple 
          and practicable 
ma simple y practicable para asegurar a 
          
program for ensuring depth learning for 
todos los estudiantes 
          un aprendizaje en 
all students, and it seems to merit wider 
          
profundidad y merece, en ese sentido, 
experimental 
          implementations. It also re­
que se realicen implementaciones 
          experi­
quires somewhat new forms of teaching.
mentales más 
          amplias. Asimismo, requie­
re nuevas formas de 
          enseñanza.
Palabras claves: aprendizaje, 
          profundi­
Key Words: learning, depth, teaching, 
dad, 
          enseñanza, curriculum.
curriculum.
Detalle obra “Tierra 
          árida”
Ricardo Arcuri
Introducción 
El curriculum 
          escolar general está diseñado para equipar a los 
estudiantes con 
          cierto conocimiento sobre el mundo en general, 
sobre la historia y 
          la geografía, sobre la política en sus propios países 
y en otros, 
          sobre lo que está sucediendo en el ámbito de las ciencias, 
sobre 
          las artes y la literatura, entre otros temas. Además, esperamos 
          
que la amplitud del conocimiento no sea una mera acumulación 
          
de hechos, sino que a su vez implique principios de ordenamiento 
          
conceptual que aseguren a los estudiantes desarrollar cierta 
          com-
prensión general. También esperamos que la persona educada 
          haya 
desarrollado hábitos de reflexión crítica acerca de lo que se 
          sabe.
Inevitablemente, como hay simplemente demasiado para cubrir 
          
en el currículo –el cual sirve como una especie de gran 
          enciclope-
dia de conocimiento humano en líneas generales– los 
          estudiantes 
tienden, en el mejor de los casos, a terminar la 
          escuela con una am-
plitud de conocimiento un tanto superficial. 
          Por lo general, en es-
pecial para los estudiantes más exitosos, 
          las escuelas brindan opor-
(*) Faculty of Education
tunidades 
          para especializarse en cierta área de estudio. Esto con 
Simon 
          Fraser University
Burnaby, B.C. Canada V5A 1S6
frecuencia 
          constituye una introducción un poquito más profunda 
egan@xxxxxx
hacia esa 
          área de especialización, la cual, en comparación con el 
gcj@xxxxxx
conocimiento 
          genuino, sólo puede considerarse un poquito menos 
superficial que 
          lo que se aprende en el resto del curriculum. 
ISSN 
          2313-934X
Facultad de Ciencias Humanas
http://www
Vol. XVI, Nº 1
.fchst.unlpam.edu.ar/ojs/index.php/praxis/
13
(enero 
          - junio 2013)
UNLPam
V
pp. 22-28
ol. XVII, Nº 1, 
          pp. 
      13-23



                                          

Other related posts: