[greenstone_es] pdftotext: command not found

  • From: Nicolás Rucks <nrucks@xxxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Tue, 2 Feb 2010 13:08:03 -0300

Hola gente,
estoy queriendo probar importar archivos PDF de manera tal que el import.pl los 
pase a TXT y no HTML, tal como aparentemente debería permitirlo según 
pluginfo.pl PDFPlugin

Esto requiere que en collect.cfg tenga la línea 
plugin         PDFPlugin -convert_to text
(la tengo, obviamente).

El problema es que me devuelve este mensaje de error, ningún PDF es 
transformado:

Error executing pdftotext 
"/var/www/gsdl/collect/libros2/tmp/fil-libros-e-isbn9264195467-s000.pdf" 
"/var/www/gsdl/collect/libros2/tmp/fil-libros-e-isbn9264195467-s000.text" > 
"/var/www/gsdl/collect/libros2/tmp/fil-libros-e-isbn9264195467-s000.out" 2> 
"/var/www/gsdl/collect/libros2/tmp/fil-libros-e-isbn9264195467-s000.err": Bad 
file descriptor
pdftotext error log:
sh: pdftotext: command not found
Could not convert fil-libros-e-isbn9264195467-s000.pdf to Text format
sh: pdftotext: command not found

Encontré en 
http://trac.greenstone.org/ticket/390
los siguientes comentarios:
<<
If you select convert_to text for PDFPlugin, it tries to run pdftotext. But we 
don't supply this, and the conversion fails. 
Should we supply it? 
Should we try a different format?
>>

LA PREGUNTA:
Alguien tiene el "pdftotext" ?

PD: estoy usando Greenstone 2.81 sobre Linux.

Gracias!

Nicolas Rucks
Biblioteca Cardini
Fundación Instituto Leloir

Other related posts: