[greenstone_es] Re: consulta sobre Greenstone y apache

  • From: "Zbicajnik Pedro" <pedro.zbicajnik@xxxxxxxxxxxx>
  • To: <greenstone_es@xxxxxxxxxxxxx>
  • Date: Fri, 15 May 2015 09:23:52 -0300

Ten envio las salidas y los archivos. Gracias!



root@greenstone:/usr/local/Greenstone# . ./setup.bash

Su ambiente ha sido configurado para correr los programas Greenstone.

+Your environment is now setup for the ImageMagick extension

+Adding in executable path for apache-httpd

root@greenstone:/usr/local/Greenstone# pluginfo.pl -listall > list.xml 2>&1

root@greenstone:/usr/local/Greenstone# pluginfo.pl -describeall > describe.xml
2>&1





Descripción: cid:0A1CA7BA526B49689719F474783486BF@slafraternidad.inet

Pedro Zbicajnik

Dto. Sistemas



De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: jueves, 14 de mayo de 2015 05:33 p.m.
Para: Lista (en español) Greenstone
Asunto: [greenstone_es] Re: consulta sobre Greenstone y apache



Pedro, probemos lo siguiente para descartar cosas.



Abri una ventana de consola y ejecutá estos pasos:




$ . ./setup.bash
$ <http://pluginfo.pl/> pluginfo.pl -listall > list.xml 2>&1

Despues:

$ <http://pluginfo.pl/> pluginfo.pl -describeall > describe.xml 2>&1

Ambos comandos deberían imprimir información sobre los plugins en formato XML.
Enviame esos archivos para poder revisarlos.

Saludos!.


Diego





Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313

Argentina
<mailto:dspano@xxxxxxxxxxxxxxxxxxxxxxx> dspano@xxxxxxxxxxxxxxxxxxxxxxx |
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.prodigioconsultores.com%2F&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
www.prodigioconsultores.com

Contact me: Descripción: Imagen quitada por el remitente. Skype diegospano


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.linkedin.com%2Fin%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Imagen quitada por el remitente.


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.twitter.com%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Imagen quitada por el remitente. Follow teststamp on Twitter





2015-05-14 10:16 GMT-03:00 Zbicajnik Pedro <pedro.zbicajnik@xxxxxxxxxxxx>:











Hola, buen dìa

Antes que nada agradezco mucho la ayuda que brindan me es de mucha utilidad.



Siguiendo el tema de ayer el error anterior me parecia un tema de permisos



Deje los permisos en las carpetas tmp y collect de greenstone con el usuario
que según veo yo utiliza la gliremota daemon:staff



drwxrwsrwx 10 daemon staff 4096 may 14 09:47 tmp

drwxrwsrwx 6 daemon staff 4096 may 14 10:05 collect



al dejarlo asi el error cambio

me da error al importar, aunque no puedo ver bien el error en la pantalla,
busque en los logs de greenstone pero no lo vi.



Por un lado quisiera saber como tener con figurado correctamente los permisos
de las carpetas.

Por otro lado los logs, quizas me falta habilitar algo para mas detalle

Igualmente utilizando la gli local si pude crear colleciones, pero esta cuando
la usa pone los permisos como usuario.staff



Una ultima pregunta que es la apleet version of gli tiene que ver con este
cliente que estoy usando en windows o es otra

# Set gliapplet to "enabled" if you want remote users

# to be able to build collections on your server through an applet

# version of GLI

gliapplet disabled



Nuevamente gracias, y cuando puedan espero una respuesta o una guia.



Descripción: cid:image003.jpg@01D08E2F.05E909F0





Descripción: Descripción:
cid:0A1CA7BA526B49689719F474783486BF@slafraternidad.inet

Pedro Zbicajnik

Dto. Sistemas



De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: miércoles, 13 de mayo de 2015 01:06 p.m.
Para: Lista (en español) Greenstone
Asunto: [greenstone_es] Re: consulta sobre Greenstone y apache



Fijate que quizas te falte el parser de xml:



apt-get install libxml-parser-perl




Saludos!.

Diego





Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313

Argentina
<mailto:dspano@xxxxxxxxxxxxxxxxxxxxxxx> dspano@xxxxxxxxxxxxxxxxxxxxxxx |
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.prodigioconsultores.com%2F&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
www.prodigioconsultores.com

Contact me: Descripción: Descripción: Imagen quitada por el remitente. Skype
diegospano


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.linkedin.com%2Fin%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Descripción: Imagen quitada por el remitente.


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.twitter.com%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Descripción: Imagen quitada por el remitente. Follow teststamp on
Twitter





2015-05-13 13:00 GMT-03:00 Zbicajnik Pedro <pedro.zbicajnik@xxxxxxxxxxxx>:

Molesto nuevamente

Instale greenstone 2.86 en debian desde los binarios lanzando el ejecutable.



Se instalo ok.



Intento ahora en primer lugar conectarme usando la gli remota desde por ej un
windows desde el icono que crea la instalacion: remote librarian interface
(client gli)

Previamente lei lo que me pasaste y el check del gliserver da ok





Descripción: Descripción: cid:image001.jpg@01D08D7C.CCDCADE0





Luego pide la url del server remoto y me pide el user



Entonces tira este error de perl que todavía no entiendo bien a que se debe, me
lo tira abriendo la gli remota desde Windows y también el mismo error desde
Linux

Conectando al localhost



Que puede ser? Tiene que ver el idioma en que se instalo greenstone en el
server¿



Descripción: Descripción: cid:image008.jpg@01D08D7C.CCDCADE0

Descripción: Descripción: Descripción:
cid:0A1CA7BA526B49689719F474783486BF@slafraternidad.inet

Pedro Zbicajnik

Dto. Sistemas



De: greenstone_es-bounce@xxxxxxxxxxxxx
[mailto:greenstone_es-bounce@xxxxxxxxxxxxx] En nombre de Diego Spano
Enviado el: miércoles, 13 de mayo de 2015 10:45 a.m.
Para: Lista (en español) Greenstone
Asunto: [greenstone_es] Re: consulta sobre Greenstone y apache



Pedro,



GS funciona perfectamente sobre Windows. Lo que no se es que tan bien responde
Windows con el Apache y los .htaccess. Yo recomiendo usarlo en Linux y ahi no
vas a tener problema con el Apache y los htaccess. De todas formas si querés
proteger el ingreso a las colecciones GS provee un mecanismo para eso:



http://wiki.greenstone.org/doku.php?id=en:user:authentication (fijate en la
solapa Greenstone2)



Por otro lado, el GLI remoto requiere una configuración que hay que seguir. Acá
está el detalle:



http://wiki.greenstone.org/doku.php?id=en:release:2.86_release_notes
<http://wiki.greenstone.org/doku.php?id=en:release:2.86_release_notes&s%5b%5d=remote&s%5b%5d=gli#working_with_remote_greenstone_and_the_gli-client>
&s[]=remote&s[]=gli#working_with_remote_greenstone_and_the_gli-client



Espero que te ayude.








Saludos!.

Diego





Diego Spano Director de Proyectos, Prodigio Consultores
Tel: (54 11) 5093-5313

Argentina
<mailto:dspano@xxxxxxxxxxxxxxxxxxxxxxx> dspano@xxxxxxxxxxxxxxxxxxxxxxx |
<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.prodigioconsultores.com%2F&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
www.prodigioconsultores.com

Contact me: Descripción: Descripción: Descripción: Imagen quitada por el
remitente. Skype diegospano


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.linkedin.com%2Fin%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Descripción: Descripción: Imagen quitada por el remitente.


<http://s.wisestamp.com/links?url=http%3A%2F%2Fwww.twitter.com%2Fdiegospano&sn=ZGllZ29zcGFub0BnbWFpbC5jb20%3D>
Descripción: Descripción: Descripción: Imagen quitada por el remitente. Follow
teststamp on Twitter





2015-05-12 15:16 GMT-03:00 Zbicajnik Pedro <pedro.zbicajnik@xxxxxxxxxxxx>:

Que tal

Instale Greenstone en un Windows 7 64bits

Funciona el sitio



Quiero ponerle validación de usuario a las colecciones que solo se acceden por
web a determinados usuarios

Quiero usar .htaccess



En el httpd.conf

Puse AllowOverride All

Descomente mod_rewrite.so



Cree los archivos .htaccess y .htpasswd

Los coloco en la carpeta collect dentro de la colección que quiero validar.

Reinicio el servicio, pero no me toma la validación. Puedo entrar a todo el
sitio desde la web sin problemas.

Puedo utilizar el .htaccess con greenstone? Como se hace hay algún lugar donde
lo explique?





También instale greenstone (desde el ejecutable) en debian7 – en verdad
preferiría usarlo con Linux.



Funciona el sitio pero quiero que los usuarios que crean colecciones se
conecten en forma remota

Deben utilizar la gli remote Librarian Interface?

Si utilizo esta aplicación desde Windows hacia el server debían remoto me tira
errores como

ERROR: Perl failed Perl –S pluginfo.pl -listall –lenguaje “en” –xml –gs
versión 2 2



Si mis preguntas ya están en algún lugar solo pido me pasen el link, hace vs
días que no puedo solucionar estos temas.



Hay alguna guía paso a paso para instalar greenstone en debían, y que funcione
correctamente tanto perl, java y apache.

gracias





Descripción: Descripción: Descripción: Descripción:
cid:0A1CA7BA526B49689719F474783486BF@slafraternidad.inet

Pedro Zbicajnik

Dto. Sistemas









JPEG image

GIF image

JPEG image

JPEG image

JPEG image

JPEG image

JPEG image

<?xml version="1.0" encoding="UTF-8"?>
<PluginList length="52">
<PlugInfo>
<Name>CSVPlugin</Name>
<Desc>Plugin para ficheros con valores separados por comas. Se creará un
nuevo documento para cada línea del fichero.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)(\.csv)$</Processes>
<Blocks></Blocks>
<Explodes>yes</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)(\.csv)$</Default>
</Option>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\r?\n</Default>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>SplitTextFile</Name>
<Desc>SplitTextFile es un conector para dividir archivos de entrada en
segmentos que se procesarán de manera individual. Este conector no debe
llamarse de manera directa. En cambio, si usted necesita procesar archivos
input que contienen varios documentos, debe escribir un conector con una
función de proceso que manejará uno de esos documentos habiéndolo
tomado de SplitTextFile. Vea ReferPlugin para un ejemplo.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>OggVorbisPlugin</Name>
<Desc>Plugin para importar archivos de audio Ogg Vorbis.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)(\.ogg)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>(?i)(\.ogg)$</Default>
</Option>
<Option>
<Name>add_technical_metadata</Name>
<Desc>Añadir metadatos técnicos (ej. bitrate)</Desc>
<Type>flag</Type>
<Default></Default>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>base64</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>MediainfoOGVPlugin</Name>
<Desc>Plugin para la importación de archivos de video OGV. Requiere tener
instalado Medianfo (mediainfo.sourceforge.net) para extraer los
metadatos.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.ogv$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.ogv$</Default>
</Option>
<Option>
<Name>assoc_field</Name>
<Desc>Nombre del campo de metadato que contendrá el nombre del
video.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>Movie</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ReferPlugin</Name>
<Desc>ReferPlug lee archivos bibliográficos en formato Refer.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.bib$</Processes>
<Blocks></Blocks>
<Explodes>yes</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.bib$</Default>
</Option>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\n\s*\n</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>SplitTextFile</Name>
<Desc>SplitTextFile es un conector para dividir archivos de entrada en
segmentos que se procesarán de manera individual. Este conector no debe
llamarse de manera directa. En cambio, si usted necesita procesar archivos
input que contienen varios documentos, debe escribir un conector con una
función de proceso que manejará uno de esos documentos habiéndolo
tomado de SplitTextFile. Vea ReferPlugin para un ejemplo.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>CONTENTdmPlugin</Name>
<Desc>Conector que procesa archivos RDF en colecciones CONTENTdm
exportadas.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.rdf$</Processes>
<Blocks>(?i)\.(jpg|jpeg|gif)$</Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>pagedimg</Name>
<Desc>Una serie de imágenes.</Desc>
</Value>
</List>
<Default>html</Default>
</Option>
<Option>
<Name>xslt</Name>
<Desc>Transforma un documento de entrada que cumple la condición con
la XSLT contenida en el nombre de fichero. Se asume que existe un nombre de
fichero relativo en el área de ficheros de la colección, por ejemplo
etc/mods2dc.xsl.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.rdf$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default>(?i)\.(jpg|jpeg|gif)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
<PlugInfo>
<Name>MARCPlugin</Name>
<Desc>Plugin MARC básico.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)(\.marc)$</Processes>
<Blocks></Blocks>
<Explodes>yes</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>metadata_mapping</Name>
<Desc>SUSTITUIDO Nombre de fichero que incluye la correspondencia
detallada de valores MARC para los nombres de los metadatos de Greenstone.
Predeterminado a 'marc2dc.txt' que se encuentra en el directorio etc del
sitio.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>metadata_mapping_file</Name>
<Desc>Nombre del fichero que incluye los detalles de mapeado de valores
MARC a nombres de metadatos Greenstone. Predefinido a 'marc2dc.txt', en el
directorio etc del sitio.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>marc2dc.txt</Default>
</Option>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)(\.marc)$</Default>
</Option>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\r?\n\s*\r?\n|\[\w+\]Record type: USmarc</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>SplitTextFile</Name>
<Desc>SplitTextFile es un conector para dividir archivos de entrada en
segmentos que se procesarán de manera individual. Este conector no debe
llamarse de manera directa. En cambio, si usted necesita procesar archivos
input que contienen varios documentos, debe escribir un conector con una
función de proceso que manejará uno de esos documentos habiéndolo
tomado de SplitTextFile. Vea ReferPlugin para un ejemplo.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>RogPlugin</Name>
<Desc>Crea los documentos simples single-level (de nivel único) a partir
de archivos .rog o .mdb.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.(mdb|rog)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.(mdb|rog)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>BookPlugin</Name>
<Desc>Crea documentos multinivel a partir de documentos que contengan
etiquetas de nivel &amp;lt;&amp;lt;TOC&amp;gt;&amp;gt;. Los metadatos para cada
sección se toman de cualquier otra etiqueta que esté en la misma línea
que el &amp;lt;&amp;lt; TOC &amp;gt;&amp;gt;, por ej.,
&amp;lt;&amp;lt;Title&amp;gt;&amp;gt; xxxx
&amp;lt;&amp;lt;/Title&amp;gt;&amp;gt; establece el metadato Título. Todo lo
demás que aparezca entre las etiquetas TOC se tratará como html simple
(es decir, no se establece ningún proceso de vínculos html ni se ejcuta
ninguna otra tarea del conector HTMLPlugin). Se espera que los archivos de
entrada tengan una extensión .hb predefinida (puede cambiarse agregando una
opción -process_exp, un fichero con el mismo nombre que el fichero hb pero
con una extensión .jpg se toma como la imagen de la portada (los ficheros
jpg son bloqueados por este plugin). BookPlugin es una simplificación (y
extensión) del HBPlugin utilizado por las colecciones de la Biblioteca de
Desarrollo Humanitario. BookPlugin es más rápido en tanto que espera la
entrada de archivos más limpios (La entrada a las colecciones de HDL
contiene muchas etiquetas html adicionales alrededor de etiquetas
&amp;lt;&amp;lt; TOC &amp;gt;&amp;gt;, utiliza etiquetas &amp;lt;&amp;lt; I
&amp;gt;&amp;gt; para especificar las imágenes, y simplemente toma todo el
texto entre las etiquetas &amp;lt;&amp;lt; TOC &amp;gt;&amp;gt; y el inicio del
texto como metadato Title). Si usted está colocando marcas en documentos
para que sean desplegados de la misma manera que las colecciones HDL, use este
plugin en lugar de HBPlugin.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.hb$</Processes>
<Blocks>\.jpg$</Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.hb$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\.jpg$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ImagePlugin</Name>
<Desc>Este plugin procesa las imágenes, agregando los metadatos
básicos</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>

<Processes>(?i)\.(jpe?g|gif|png|bmp|xbm|tif?f|jpf|jpx|jp2|jpc|j2k|pnm|pgx)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>

<Default>(?i)\.(jpe?g|gif|png|bmp|xbm|tif?f|jpf|jpx|jp2|jpc|j2k|pnm|pgx)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ImageConverter</Name>
<Desc>Este plugin procesa las imágenes, agregando los metadatos
básicos</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>create_thumbnail</Name>
<Desc>Si se configura como true, crea una versión miniatura de cada
imagen y agrega los metadatos Thumb, ThumbType, thumbicon, ThumbWidth,
ThumbHeight.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>true</Default>
</Option>
<Option>
<Name>thumbnailsize</Name>
<Desc>Realiza iconos pequeños tamaño nxn.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>100</Default>
</Option>
<Option>
<Name>thumbnailtype</Name>
<Desc>Realiza iconos pequeños en el formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>gif</Default>
</Option>
<Option>
<Name>noscaleup</Name>
<Desc>No sobreponga las imágenes pequeñas al hacer thumbnails
.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>create_screenview</Name>
<Desc>Si se configura como true, crea una imagen tamaño pantalla y
asigna los metadatos Screen, ScreenType, screenicon, ScreenWidth,
ScreenHeight.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>true</Default>
</Option>
<Option>
<Name>screenviewsize</Name>
<Desc>Producir imágenes "screenview" de tamaño nxn.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>500</Default>
</Option>
<Option>
<Name>screenviewtype</Name>
<Desc>Producir imágenes "screenview" en formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>jpg</Default>
</Option>
<Option>
<Name>converttotype</Name>
<Desc>Convertir la imagen principal al formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>minimumsize</Name>
<Desc>Ignore las imágenes menores que n bytes.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>100</Default>
</Option>
<Option>
<Name>apply_aspectpad</Name>
<Desc>{ImageConverter.apply_aspectpad}</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>false</Default>
</Option>
<Option>
<Name>aspectpad_ratio</Name>
<Desc>{ImageConverter.aspectpad_ratio}</Desc>
<Type>string</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>2</Default>
</Option>
<Option>
<Name>aspectpad_mode</Name>
<Desc>{ImageConverter.aspectpad_mode}</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>al</Name>
<Desc>{aspectpad.al}</Desc>
</Value>
<Value>
<Name>ap</Name>
<Desc>{aspectpad.ap}</Desc>
</Value>
<Value>
<Name>l</Name>
<Desc>{aspectpad.l}</Desc>
</Value>
<Value>
<Name>p</Name>
<Desc>{aspectpad.p}</Desc>
</Value>
</List>
<Default>al</Default>
</Option>
<Option>
<Name>aspectpad_colour</Name>
<Desc>{ImageConverter.aspectpad_colour}</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>transparent</Default>
</Option>
<Option>
<Name>aspectpad_tolerance</Name>
<Desc>{ImageConverter.aspectpad_tolerance}</Desc>
<Type>string</Type>
<Required>no</Required>
<Range>0,</Range>
<Default>0.0</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BaseMediaConverter</Name>
<Desc>Conector que provee funcionalidad básica para los conectores
conversores de media como el ImageConverter y los conversores de video.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>enable_cache</Name>
<Desc>Almacenar en cache los archivos generados automáticamente (como
las miniaturas y las imágenes en tamaño pantalla) de manera que no
necesiten generarse repetidamente.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>FavouritesPlugin</Name>
<Desc>Conector para procesar archivos Favoritos de Internet Explorer.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.URL$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.URL$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ExcelPlugin</Name>
<Desc>Plugin para importar ficheros de Microsoft Excel (versiones 95 y
97).</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.xls$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.xls$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoLoadConverters</Name>
<Desc>Plugin auxiliar que carga dinamicamente a los plugins
conversores.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>PostScriptPlugin</Name>
<Desc>Este es un ps \"poor man’s\" para convertidor de texto. Si si plan
es serio, considere utilizar el paquete PRESCRIPT, para bajarlo lo podrá
encontrar en http://www.nzdl.org/html/software.html</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.ps$</Processes>
<Blocks>(?i)\.(eps)$</Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
<Value>
<Name>pagedimg_jpg</Name>
<Desc>Formato JPEG.</Desc>
</Value>
<Value>
<Name>pagedimg_gif</Name>
<Desc>Formato GIF.</Desc>
</Value>
<Value>
<Name>pagedimg_png</Name>
<Desc>Formato PNG.</Desc>
</Value>
</List>
<Default>text</Default>
</Option>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.ps$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default>(?i)\.(eps)$</Default>
</Option>
<Option>
<Name>extract_date</Name>
<Desc>Extrae la fecha del encabezado de PS.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>extract_pages</Name>
<Desc>Extrae las páginas del encabezado de PS.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>extract_title</Name>
<Desc>Extrae el encabezado de PS inicial.</Desc>
<Type>flag</Type>
</Option>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>DirectoryPlugin</Name>
<Desc>RecPlug es un plugin que recorre el árbol de directorios
recursivamente, procesando cada fichero encontrado.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks>(?i)(CVS|\.svn|Thumbs\.db|OIDcount|\.DS_Store|~)$</Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)(CVS|\.svn|Thumbs\.db|OIDcount|\.DS_Store|~)$</Default>
</Option>
<Option>
<Name>use_metadata_files</Name>
<Desc>SUSTITUIDO - Añadir MetadataXMLPlugin a la lista de plugins para
que se puedan leer los metadatos desde los archivos XML de metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>recheck_directories</Name>
<Desc>Después de procesar los archivos en un directorio de
importación, vuelva a leer el directorio para descubrir los nuevos archivos
creados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
</PlugInfo>
<PlugInfo>
<Name>WordPlugin</Name>
<Desc>Plugin importador para los documentos de Microsoft Word.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.(doc|dot)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.(doc|dot)$</Default>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoLoadConverters</Name>
<Desc>Plugin auxiliar que carga dinamicamente a los plugins
conversores.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>RealMediaPlugin</Name>
<Desc>Plugin para procesar ficheros Real Media</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)(\.rm|rmvb)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)(\.rm|rmvb)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>MediaWikiPlugin</Name>
<Desc>Plugin para importar páginas web de MediaWiki</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>show_toc</Name>
<Desc>Añade a la página Sobre la colección la 'tabla de
contenidos' de la página principal del sitio de MediaWiki. Necesita una
expresión regular Perl debajo, en toc_exp, que coincida con la sección
'tabla de contenidos'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>delete_toc</Name>
<Desc>Borra la sección 'tabla de contenidos' de cada página HTML.
Necesita especificar una expresión regular Perl debajo, en toc_exp, que
coincida con la sección 'tabla de contenidos'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>toc_exp</Name>
<Desc>Expresión regular Perl que coincida con 'tabla de contenido'. El
valor predefinido coincide con las páginas comunes de MediaWiki.</Desc>
<Type>regexp</Type>
<Required>no</Required>

<Default>&lt;table([^&gt;]*)id=(\"|')toc(\"|')(.|\n)*?&lt;/table&gt;\n</Default>
</Option>
<Option>
<Name>delete_nav</Name>
<Desc>Boorar la sección de navegación. Necesita que se especifique
una expresión regular Perl debajo, en nav_div_exp.</Desc>
<Type>flag</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>nav_div_exp</Name>
<Desc>Expresión regular Perl que coincida con la sección de
navegación. El valor predefinido coincide con páginas comunes de
MediaWiki.</Desc>
<Type>regexp</Type>
<Required>no</Required>

<Default>&lt;div([^&gt;]*)id=(\"|')p-navigation(\"|')(.|\n)*?&lt;/div&gt;</Default>
</Option>
<Option>
<Name>delete_searchbox</Name>
<Desc>Borrar la sección de la caja de búsqueda. Necesita
especificar una expresión regular Perl debajo, en searchbox_div_exp.</Desc>
<Type>flag</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>searchbox_div_exp</Name>
<Desc>Una expresión regular Perl para contrastar contra la sección
del cuadro de búsqueda. El valor por defecto se corresponde con páginas
web de MediaWiki</Desc>
<Type>regexp</Type>
<Required>no</Required>

<Default>&lt;div([^&gt;]*)id=(\"|')p-search(\"|')(.|\n)*?&lt;/div&gt;</Default>
</Option>
<Option>
<Name>remove_title_suffix_exp</Name>
<Desc>Expresión regular Perl para recortar el título extraido. Por
ejemplo, \\s-(.+) cortará el contenido del título después de
"-".</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>HTMLPlugin</Name>
<Desc>Este plugin procesa archivos HTML</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>

<Processes>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>

<Default>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>nolinks</Name>
<Desc>No se esfuerce por tomar links (poniendo esta bandera puede mejorar
la velocidad para crear/importar pero cualquier link relativo dentro de los
documentos se romperá).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>keep_head</Name>
<Desc>No elimine los títulos de los archivos html.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>no_metadata</Name>
<Desc>No intente extraer metadatos de los archivos.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>metadata_fields</Name>
<Desc>Listado de campos de metadatos separados por comas para intentar
extraer. Use 'tag&amp;lt;tagname&amp;gt;' para tener los contenidos del primer
par &amp;lt;tagname&amp;gt; en un elemento del metadato llamado 'tagname'
(nombre de etiqueta). Ponga en mayúsculas esto si desea el metadato en
mayúsculas en Greenstone, ya que la extracción de la etiqueta no es
sensible a las mayúsculas, por ejemplo, Title,Date.</Desc>
<Type>string</Type>
<Default>Title</Default>
</Option>
<Option>
<Name>metadata_field_separator</Name>
<Desc>Carácter separador utilizado en metadatos multi-valor.
Dividirá el campo de metadato cada vez que encuentre este carácter, y
cada item será agregado como un metadato individual.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>hunt_creator_metadata</Name>
<Desc>Localiza tantos metadatos como sea posible en autor y los coloca en
el campo 'Creator'.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>file_is_url</Name>
<Desc>Marque si los nombres de los ficheros de la entrada constituyen el
url de los documentos fuente originales, por ej. si una herramienta para
descargar páginas web fuera utilizada para crear la estructura del
directorio de importación.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>assoc_files</Name>
<Desc>Expresión Perl normal de las extensiones de archivo para asociar
con documentos html.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>rename_assoc_files</Name>
<Desc>Renombra archivos asociados con documentos (por ejemplo
imágenes). También crea mucha estructura de directorios de poco peso
(útil al crear las colecciones cd-rom).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>w3mir</Name>
<Desc></Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>no_strip_metadata_html</Name>
<Desc>Lista de nombres de metadatos separados por comas o 'all'.
Utilizado con -description_tags, evita la supresión de las etiquetas HTML de
los valores de los metadatos especificados.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>sectionalise_using_h_tags</Name>
<Desc>Crea automáticamente un documento con secciones, usando las
etiquetas h1, h2, ... hx.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>use_realistic_book</Name>
<Desc>Si se activa, convierte un fichero HTML en un XHTML bien formado.
Permite a los usuarios ver el documento en formato libro.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>old_style_HDL</Name>
<Desc>Para marcar los ficheros de esta colección que se seccionan
usando el antiguo estilo de sección HDL.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>processing_tmp_files</Name>
<Desc>Marca interna, fijada por los plugins conversores para indicar que
están procesando un archivo tmp.</Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>LaTeXPlugin</Name>
<Desc>Plugin para documentos LaTeX.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>\.tex$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\.tex$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ZIPPlugin</Name>
<Desc>Plugin que se ocupa de los formatos comprimidos y/o archivados de
entrada los formatos actualmente manejados y las extensiones de archivo son
are:\ngzip de (.gz. z. el tgz. taz)\nbzip (.bz)\nbzip2 (.bz2)\nzip (.zip.
.jar)\ntar\n\n Este plugin confía en las utilerías siguientes que
están presentes (si está intentando procesar formatos correspondientes)
:\ngunzip (para gzip)\nbunzip (para bzip)\nbunzip2 \nunzip (para zip)\ntar
(para tar)</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.(gz|tgz|z|taz|bz|bz2|zip|jar|tar)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>(?i)\.(gz|tgz|z|taz|bz|bz2|zip|jar|tar)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>FOXPlugin</Name>
<Desc>Plugin para procesar un archivo Foxbase dbt. Este plugin proporciona la
funcionalidad básica para leer los archivos dbt y dbf y procesa cada
registro. Debería escribirse un plugin específico basado en este de
propósito general para una base de datos en particular.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.dbf$</Processes>
<Blocks>(?i)\.dbt$</Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.dbf$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.dbt$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>NulPlugin</Name>
<Desc>Plugin de fichero nulo (.nul). Utilizado con los archivos producidos al
expandir los ficherosos de la base de datos de metadatos.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.nul$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.nul$</Default>
</Option>
<Option>
<Name>assoc_field</Name>
<Desc>Nombre del campo de metadato a asignar para cada fichero
nulo.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>null_file</Default>
</Option>
<Option>
<Name>add_metadata_as_text</Name>
<Desc>Añadir una tabla de metadatos como el texto del documento, antes
que "Este documento no tiene texto".</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>remove_namespace_for_text</Name>
<Desc>Borra los espacios de nombres de los nombres de metadatos en el
texto del documento (si se ha marcado add_metadata_as_text).</Desc>
<Type>flag</Type>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>GreenstoneXMLPlugin</Name>
<Desc>Procesa los documentos XML de Archivo de Greenstone. Note que este
conector no realiza ninguna verificación de sintaxis (aunque el módulo de
XML::Parser comprueba la correcta forma). Se asume que los ficheros de Archivo
de Greenstone son conformes a su DTD.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)doc(-\d+)?\.xml$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)doc(-\d+)?\.xml$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadXMLFile</Name>
<Desc>La clase base para plugins XML.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.xml$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.xml$</Default>
</Option>
<Option>
<Name>xslt</Name>
<Desc>Transforma un documento de entrada que cumple la condición con
la XSLT contenida en el nombre de fichero. Se asume que existe un nombre de
fichero relativo en el área de ficheros de la colección, por ejemplo
etc/mods2dc.xsl.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ArchivesInfPlugin</Name>
<Desc>Plugin que procesa la base de datos de archivos (archiveinf-doc) la
cual es generada por el proceso de importación. Envia a cada archivo listado
en la base de datos para que sea procesado por GreenstoneXMLPlugin.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>reversesort</Name>
<Desc>Ordenar en forma inversa. Es útil si se ha indicado la opción
-sortmeta en el proceso import.pl</Desc>
<Type>flag</Type>
<Required>no</Required>
<ModeGLI>2</ModeGLI>
</Option>
<Option>
<Name>sort</Name>
<Desc>Ordenar en orden alfabético ascendente. Util si también se
usa la opción -sortmeta en import.pl.</Desc>
<Type>flag</Type>
<Required>no</Required>
<ModeGLI>2</ModeGLI>
</Option>
</Arguments>
</PlugInfo>
<PlugInfo>
<Name>BibTexPlugin</Name>
<Desc>BibTexPlugin lee archivos de registros bibliográficos en formato
BibTex. BibTexPlugin crea un objeto de documento para cada referencia en el
archivo. Es una subclase de SplitTextFile, por lo que si hay registros
múltiples, todos se leen.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.bib$</Processes>
<Blocks></Blocks>
<Explodes>yes</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.bib$</Default>
</Option>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\n+(?=@)</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>SplitTextFile</Name>
<Desc>SplitTextFile es un conector para dividir archivos de entrada en
segmentos que se procesarán de manera individual. Este conector no debe
llamarse de manera directa. En cambio, si usted necesita procesar archivos
input que contienen varios documentos, debe escribir un conector con una
función de proceso que manejará uno de esos documentos habiéndolo
tomado de SplitTextFile. Vea ReferPlugin para un ejemplo.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>HBPlugin</Name>
<Desc>Plugin que procesa un directorio de libro HTML. Este plugin es usado
por las colecciones de la Biblioteca de Desarrollo Humanitario y no manipula
codificaciones de entrada más que de ASCII o el ASCII extendido. Este
código es algo algo engorroso y podría, sin dudas, corregirse para que se
ejcute más rápidamente indudablemente, dejándolo en este estado espero
animar a las personas para que hagan sus colecciones utilizando el BookPlugin
en cambio ;-)\n\nUse utilice BookPlugin si está creando una nueva
colección y marcando a los archivos como las colecciones de la Biblioteca de
Desarrollo Humanitario. BookPlugin acepta todas las codificaciones de entrada
pero espera que los archivos marcados sean más limpios que aquellos usados
por las colecciones de la Biblioteca de Humanidades</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>This plugin does not use a process_exp
</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>This plugin does not use a process_exp
</Default>
</Option>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (idiomas occidentales)</Desc>
</Value>
</List>
<Default>iso_8859_1</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>HTMLPlugin</Name>
<Desc>Este plugin procesa archivos HTML</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>

<Processes>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>

<Default>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>nolinks</Name>
<Desc>No se esfuerce por tomar links (poniendo esta bandera puede mejorar
la velocidad para crear/importar pero cualquier link relativo dentro de los
documentos se romperá).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>keep_head</Name>
<Desc>No elimine los títulos de los archivos html.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>no_metadata</Name>
<Desc>No intente extraer metadatos de los archivos.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>metadata_fields</Name>
<Desc>Listado de campos de metadatos separados por comas para intentar
extraer. Use 'tag&amp;lt;tagname&amp;gt;' para tener los contenidos del primer
par &amp;lt;tagname&amp;gt; en un elemento del metadato llamado 'tagname'
(nombre de etiqueta). Ponga en mayúsculas esto si desea el metadato en
mayúsculas en Greenstone, ya que la extracción de la etiqueta no es
sensible a las mayúsculas, por ejemplo, Title,Date.</Desc>
<Type>string</Type>
<Default>Title</Default>
</Option>
<Option>
<Name>metadata_field_separator</Name>
<Desc>Carácter separador utilizado en metadatos multi-valor.
Dividirá el campo de metadato cada vez que encuentre este carácter, y
cada item será agregado como un metadato individual.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>hunt_creator_metadata</Name>
<Desc>Localiza tantos metadatos como sea posible en autor y los coloca en
el campo 'Creator'.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>file_is_url</Name>
<Desc>Marque si los nombres de los ficheros de la entrada constituyen el
url de los documentos fuente originales, por ej. si una herramienta para
descargar páginas web fuera utilizada para crear la estructura del
directorio de importación.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>assoc_files</Name>
<Desc>Expresión Perl normal de las extensiones de archivo para asociar
con documentos html.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>rename_assoc_files</Name>
<Desc>Renombra archivos asociados con documentos (por ejemplo
imágenes). También crea mucha estructura de directorios de poco peso
(útil al crear las colecciones cd-rom).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>w3mir</Name>
<Desc></Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>no_strip_metadata_html</Name>
<Desc>Lista de nombres de metadatos separados por comas o 'all'.
Utilizado con -description_tags, evita la supresión de las etiquetas HTML de
los valores de los metadatos especificados.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>sectionalise_using_h_tags</Name>
<Desc>Crea automáticamente un documento con secciones, usando las
etiquetas h1, h2, ... hx.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>use_realistic_book</Name>
<Desc>Si se activa, convierte un fichero HTML en un XHTML bien formado.
Permite a los usuarios ver el documento en formato libro.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>old_style_HDL</Name>
<Desc>Para marcar los ficheros de esta colección que se seccionan
usando el antiguo estilo de sección HDL.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>processing_tmp_files</Name>
<Desc>Marca interna, fijada por los plugins conversores para indicar que
están procesando un archivo tmp.</Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>MetadataCSVPlugin</Name>
<Desc>Plugin para metadatos en formato de valores separados pro comas. El
campo Filename del fichero CSV se usa para determinar a que documento pertenece
el metadato.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.csv$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.csv$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>RTFPlugin</Name>
<Desc>Plugin para importar ficheros en Formato de Texto Enriquecido (Rich
Text Format, RTF)</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.rtf$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
</List>
<Default>html</Default>
</Option>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.rtf$</Default>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>HTMLImagePlugin</Name>
<Desc>Plugin para extraer imágenes y el texto asociado de páginas
web.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>aggressiveness</Name>
<Desc>El rango de técnicas de extracción de textos relacionados a
utilizar.</Desc>
<Type>int</Type>
<Required>no</Required>
<List>
<Value>
<Name>1</Name>
<Desc>Nombre de Archivo, ruta, texto alternativo (atributo ALT de los
tags img de HTML) solamente.</Desc>
</Value>
<Value>
<Name>2</Name>
<Desc>Todos de 1, más el subtítulo si hubiese disponible.</Desc>
</Value>
<Value>
<Name>3</Name>
<Desc>Todos de 2, más los párrafos disponibles.</Desc>
</Value>
<Value>
<Name>4</Name>
<Desc>Todos de 3, más los encabezados anteriores
(&amp;lt;h1&amp;gt;, &amp;lt;h2&amp;gt;...) disponibles.</Desc>
</Value>
<Value>
<Name>5</Name>
<Desc>Todos de 4, más las referencias textuales disponibles.</Desc>
</Value>
<Value>
<Name>6</Name>
<Desc>Todos de 4, más las etiquetas de las páginas HTML
(título, palabras clave, etc).</Desc>
</Value>
<Value>
<Name>7</Name>
<Desc>Todos de 6, 5 y 4 combinados.</Desc>
</Value>
<Value>
<Name>8</Name>
<Desc>Todos de 7, más la duplicación de nombre del archivo,
ruta, texto alternativo y pie (la clasificación jerárquica de resultados
más relevantes).</Desc>
</Value>
<Value>
<Name>9</Name>
<Desc>Todos de 1, más el texto completo de la página
fuente.</Desc>
</Value>
</List>
<Default>3</Default>
</Option>
<Option>
<Name>index_pages</Name>
<Desc>Indice las páginas junto con las imágenes. Por otra parte
referencia las páginas a la fuente URL.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>no_cache_images</Name>
<Desc>No esconda las imágenes (apunte al URL original).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>min_size</Name>
<Desc>Bytes. Brinca las imágenes más pequeñas que estas.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>2000</Default>
</Option>
<Option>
<Name>min_width</Name>
<Desc>Pixeles. Salta imágenes mas breves que ésta.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>50</Default>
</Option>
<Option>
<Name>min_height</Name>
<Desc>Pixeles. Salta las imágenes más pequeñas que
ésta.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>50</Default>
</Option>
<Option>
<Name>thumb_size</Name>
<Desc>Max el tamaño en miniatura. Ambos ancho y altura.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>100</Default>
</Option>
<Option>
<Name>convert_params</Name>
<Desc>Parámetros adicionales para la que ImageMagicK convierta el
ícono. Por ejemplo, '-raise' dará un efecto tridimensional a las
imágenes en miniatura.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>min_near_text</Name>
<Desc>Caracteres mínimos cerca del texto o subtitulo para
extraer.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>10</Default>
</Option>
<Option>
<Name>max_near_text</Name>
<Desc>Caracteres máximos cerca de las imágenes a extraer.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>400</Default>
</Option>
<Option>
<Name>smallpage_threshold</Name>
<Desc>Las imágenes en las páginas más pequeñas que esto
(bytes) tendrán asignados los metadatos de la página (el título, las
palabras claves, etc).</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>2048</Default>
</Option>
<Option>
<Name>textrefs_threshold</Name>
<Desc>El umbral para las referencias textuales. Los valores más bajos
significan que el algoritmo es menos estricto.</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>2</Default>
</Option>
<Option>
<Name>caption_length</Name>
<Desc>La longitud máxima de subtítulos (en caracteres).</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>80</Default>
</Option>
<Option>
<Name>neartext_length</Name>
<Desc>Longitud designada del texto mas cercano (en caracteres)</Desc>
<Type>int</Type>
<Required>no</Required>
<Default>300</Default>
</Option>
<Option>
<Name>document_text</Name>
<Desc>Agrega el texto de imagen como document:text (de lo contrario el
campo de metadatos IndexedText).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>HTMLPlugin</Name>
<Desc>Este plugin procesa archivos HTML</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>

<Processes>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>

<Default>(?i)(\.html?|\.shtml|\.shm|\.asp|\.php\d?|\.cgi|.+\?.+=.*)$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>nolinks</Name>
<Desc>No se esfuerce por tomar links (poniendo esta bandera puede mejorar
la velocidad para crear/importar pero cualquier link relativo dentro de los
documentos se romperá).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>keep_head</Name>
<Desc>No elimine los títulos de los archivos html.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>no_metadata</Name>
<Desc>No intente extraer metadatos de los archivos.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>metadata_fields</Name>
<Desc>Listado de campos de metadatos separados por comas para intentar
extraer. Use 'tag&amp;lt;tagname&amp;gt;' para tener los contenidos del primer
par &amp;lt;tagname&amp;gt; en un elemento del metadato llamado 'tagname'
(nombre de etiqueta). Ponga en mayúsculas esto si desea el metadato en
mayúsculas en Greenstone, ya que la extracción de la etiqueta no es
sensible a las mayúsculas, por ejemplo, Title,Date.</Desc>
<Type>string</Type>
<Default>Title</Default>
</Option>
<Option>
<Name>metadata_field_separator</Name>
<Desc>Carácter separador utilizado en metadatos multi-valor.
Dividirá el campo de metadato cada vez que encuentre este carácter, y
cada item será agregado como un metadato individual.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>hunt_creator_metadata</Name>
<Desc>Localiza tantos metadatos como sea posible en autor y los coloca en
el campo 'Creator'.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>file_is_url</Name>
<Desc>Marque si los nombres de los ficheros de la entrada constituyen el
url de los documentos fuente originales, por ej. si una herramienta para
descargar páginas web fuera utilizada para crear la estructura del
directorio de importación.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>assoc_files</Name>
<Desc>Expresión Perl normal de las extensiones de archivo para asociar
con documentos html.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>rename_assoc_files</Name>
<Desc>Renombra archivos asociados con documentos (por ejemplo
imágenes). También crea mucha estructura de directorios de poco peso
(útil al crear las colecciones cd-rom).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>w3mir</Name>
<Desc></Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>no_strip_metadata_html</Name>
<Desc>Lista de nombres de metadatos separados por comas o 'all'.
Utilizado con -description_tags, evita la supresión de las etiquetas HTML de
los valores de los metadatos especificados.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>sectionalise_using_h_tags</Name>
<Desc>Crea automáticamente un documento con secciones, usando las
etiquetas h1, h2, ... hx.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>use_realistic_book</Name>
<Desc>Si se activa, convierte un fichero HTML en un XHTML bien formado.
Permite a los usuarios ver el documento en formato libro.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>old_style_HDL</Name>
<Desc>Para marcar los ficheros de esta colección que se seccionan
usando el antiguo estilo de sección HDL.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>processing_tmp_files</Name>
<Desc>Marca interna, fijada por los plugins conversores para indicar que
están procesando un archivo tmp.</Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>IndexPlugin</Name>
<Desc>Este plugin recursivo procesa un fichero index.txt. El fichero
index.txt debería contener la lista de archivos que deberán ser incluidos
en la colección, seguida por cualesquiera metadatos extras que deban ser
asociados con cada fichero.\n\n El fichero index.txt debe estructurarse de la
siguiente manera: La primera línea puede ser una llave (empezando con key:)
para nombrar los ficheros de metadatos (por ejemplo, key: Asunto
Organización Fecha). Las líneas siguientes contendrán un nombre de
afichero seguido por el valor que se asignará a la entrada del metadato.
(por ejemplo, 'irma/iw097e 3.2 unesco 1993' asociará el metadato Asunto=3.2,
Organización=unesco, y Fecha=1993 con el archivo irma/iw097e si se
utilizó la línea anterior)\n\n Note que si cualquiera de los campos de
los metadatos utiliza el plugin de clasificador de Jerarquía, entonces el
valor de ellos debe corresponder al primer campo (el descriptor) en el fichero
de la clasificación apropiado.\n\nLos valores de los metadatos pueden
nombrarse utilizando una etiqueta de manera separada (por ejemplo
&amp;lt;Asunto&amp;gt;3.2) y esto prevalecerá sobre cualquier nombre que se
les haya asignado en la línea que contiene la "key". Si no hay ninguna
línea que contenga una "key", cualquier valor sin nombre de los metadatos se
denominará 'Asunto'.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ConvertToRogPlugin</Name>
<Desc>Un plugin que hereda de RogPlugin.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>RogPlugin</Name>
<Desc>Crea los documentos simples single-level (de nivel único) a partir
de archivos .rog o .mdb.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.(mdb|rog)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.(mdb|rog)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>PDFPlugin</Name>
<Desc>Plugin que procesa documentos PDF.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.pdf$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
<Value>
<Name>pagedimg_jpg</Name>
<Desc>Formato JPEG.</Desc>
</Value>
<Value>
<Name>pagedimg_gif</Name>
<Desc>Formato GIF.</Desc>
</Value>
<Value>
<Name>pagedimg_png</Name>
<Desc>Formato PNG.</Desc>
</Value>
</List>
<Default>html</Default>
</Option>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.pdf$</Default>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Default></Default>
</Option>
<Option>
<Name>metadata_fields</Name>
<Desc>Listado de campos de metadatos separados por comas para intentar
extraer. Use 'tag&amp;lt;tagname&amp;gt;' para tener los contenidos del primer
par &amp;lt;tagname&amp;gt; en un elemento del metadato llamado 'tagname'
(nombre de etiqueta). Ponga en mayúsculas esto si desea el metadato en
mayúsculas en Greenstone, ya que la extracción de la etiqueta no es
sensible a las mayúsculas, por ejemplo, Title,Date.</Desc>
<Type>string</Type>
<Default>Title,Author,Subject,Keywords</Default>
</Option>
<Option>
<Name>metadata_field_separator</Name>
<Desc>Carácter separador utilizado en metadatos multi-valor.
Dividirá el campo de metadato cada vez que encuentre este carácter, y
cada item será agregado como un metadato individual.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>noimages</Name>
<Desc>No intente extraer las imágenes de PDF.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>allowimagesonly</Name>
<Desc>Permitir ficheros PDF con texto no extraíble. Evitar tener
indicado -complex set. Sólo útil con convert_to html.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>complex</Name>
<Desc>Crea una salida más compleja. Con esta opción marcada los
html resultantes se parecerán mucho más al archivo PDF original. Para que
funcione adecuadamente debe tener instalado Ghostscript (para *nix gs debe
estar su ruta, mientras que para windows se debe tener gswin32c.exe en el
path).</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>nohidden</Name>
<Desc>Prevenga al pdftohtml de intentar extraer texto oculto. Esto
sólo es útil si la opción -complex está determinada.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>zoom</Name>
<Desc>El factor por el cual se hace acercamiento al PDF para la salida
(esto sólo es útil si el -complex esta determinado).</Desc>
<Type>int</Type>
<Range>1,3</Range>
<Default>2</Default>
</Option>
<Option>
<Name>use_sections</Name>
<Desc>Cree una sección separada para cada página del archivo de
PDF.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>description_tags</Name>
<Desc>Divide el documento en sub-secciones según aparecen las
etiquetas &amp;lt;Section&amp;gt;. '-keep_head' no tendrá efecto cuando
esta opción esté marcada.</Desc>
<Type>flag</Type>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoLoadConverters</Name>
<Desc>Plugin auxiliar que carga dinamicamente a los plugins
conversores.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>LOMPlugin</Name>
<Desc>Plugin para importar ficheros LOM (Learning Object Metadata, Metadatos
de Objetos de Aprendizaje).</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.xml$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>(?i)\.xml$</Default>
</Option>
<Option>
<Name>root_tag</Name>
<Desc>DocType para el fichero XML (o una expresión regular que
coincida con el elemento raíz).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>^(?i)lom$</Default>
</Option>
<Option>
<Name>check_timestamp</Name>
<Desc>Comprueba las fechas y horas de documentos previamente descargados,
y sólo los descarga de nuevo si el dato es más moderno.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>download_srcdocs</Name>
<Desc>Descarga el documento fuente si se indica uno (en
general^identifier^entry o technical^location).). Esta opción debería
especificar una expresión regular que coincida con los nombres de fichero
antes de su descarga. Nótese que actualemnte sólo funciona para
documentos fuera de un cortafuegos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>DatabasePlugin</Name>
<Desc>Conector que importa registros de una base de datos. Usa el módulo
Perl DBI, que incluye soporte para mysql, postgresql, valores separados por
comas (CSV), MS Excel, ODBC, sybase, etc... Pueden necesitarse módulos extra
para su uso. Véase &amp;lt;GSDLHOME&amp;gt;/etc/packages/example.dbi para un
ejemplo de uso.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.dbi$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.dbi$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>PowerPointPlugin</Name>
<Desc>Conector para importar archivos de Microsoft PowerPoint.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.ppt$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>yes</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.ppt$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoLoadConverters</Name>
<Desc>Plugin auxiliar que carga dinamicamente a los plugins
conversores.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
</Arguments>
<PlugInfo>
<Name>ConvertBinaryFile</Name>
<Desc>Este conector es heredado por otros como WordPlugin, PowerPointPlugin,
PostScriptPlugin, RTFPlugin y PDFPlugin. Facilita la conversión de éstos
tipos de documentos a HTML o a TEXTO o a una serie de imágenes. Funciona
cargando dinámicamente un conector secundario apropiado (HTMLPlugin,
StructuredHTMLPlugin, PagedImgPlugin o TEXTPlugin), según el argumento
'convert_to'.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>convert_to</Name>
<Desc>Plugin que convierte a TEXTO o a HTML o a varios tipos de imagen
(ej. JPEG, GIF, PNG).</Desc>
<Type>enum</Type>
<Required>yes</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Selecciona automáticamente el formato al cual se
convertirá. La elección del formato depende del tipo de documento
importado, por ejemplo, Word será automáticamente convertido a HTML,
mientras que PowerPoint será convertido al formato PagedImage de
Greenstone</Desc>
</Value>
<Value>
<Name>html</Name>
<Desc>Formato HTML</Desc>
</Value>
<Value>
<Name>text</Name>
<Desc>Formato texto plano.</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>keep_original_filename</Name>
<Desc>mantener el nombre de fichero original para el fichero asociado,
antes que convertirlo a doc.pdf, pdf.pdf, etc.</Desc>
<Type>flag</Type>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>apply_fribidi</Name>
<Desc>Ejecutar el programa del Algoritmo Bidireccional Unicode "fribidi"
sobre el fichero convertido (para textos escritos de derecha a
izquierda).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>use_strings</Name>
<Desc>Si está definido, una función de cadenas simple será
llamada para extraer el texto si falla la conversión.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>OpenDocumentPlugin</Name>
<Desc>Plugin para documentos en formato OASIS OpenDocument (usado por
OpenOffice 2.0)</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.o(?:d|t)(?:t|s|p|g)$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Default>(?i)\.o(?:d|t)(?:t|s|p|g)$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadXMLFile</Name>
<Desc>La clase base para plugins XML.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.xml$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.xml$</Default>
</Option>
<Option>
<Name>xslt</Name>
<Desc>Transforma un documento de entrada que cumple la condición con
la XSLT contenida en el nombre de fichero. Se asume que existe un nombre de
fichero relativo en el área de ficheros de la colección, por ejemplo
etc/mods2dc.xsl.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>UnknownPlugin</Name>
<Desc>Plugin simple para los ficherosos importados en formatos que Greenstone
no soporta. Creará un documento virtual para cada uno de esos ficheros, cada
uno de ellos se pasará a Greenstone como fichero asociado \”associated
file\” del documento.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>assoc_field</Name>
<Desc>Nombre del campo del metadato que mantendrá el nombre del
fichero asociado.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>file_format</Name>
<Desc>Tipo de archivo (ej: MPEG, MIDI, …)</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>mime_type</Name>
<Desc>Tipo mime del archivo (por ejemplo image/gif).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>srcicon</Name>
<Desc>Indique un nombre de macro (sin guiones bajos) para usar como
metadato de srcicon.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>iconunknown</Default>
</Option>
<Option>
<Name>process_extension</Name>
<Desc>Procesar archivos con esta extensión de archivo. Esta oopción
es una alternativa a process_exp más sencilla de usar pero menos
flexible.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>MP3Plugin</Name>
<Desc>Plugin para procesar archivos MP3.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)\.mp3$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)\.mp3$</Default>
</Option>
<Option>
<Name>assoc_images</Name>
<Desc>Use la búsqueda de imágenes de Google para localizar
imágenes relacionadas con ficheros MP3 usando Título ID3 y metadato de
Artista.</Desc>
<Type>flag</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>applet_metadata</Name>
<Desc>Usado para almacenar [applet] metadatos para cada documento que
contiene el HTML necesario para que un applet de audio MP3 pueda reproducir ese
archivo.</Desc>
<Type>flag</Type>
<Default></Default>
</Option>
<Option>
<Name>metadata_fields</Name>
<Desc>Lista de campos de metadatos separados por comas, a extraer
(asumiendo los existentes) de un archivo MP3. Use \"*\" para extraer todos los
campos.</Desc>
<Type>string</Type>
<Default>Title,Artist,Genre</Default>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>base64</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>ProCitePlugin</Name>
<Desc>Plugin para bases de datos Procite (exportadas)</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>(?i)(\.txt)$</Processes>
<Blocks></Blocks>
<Explodes>yes</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>(?i)(\.txt)$</Default>
</Option>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>\n</Default>
</Option>
<Option>
<Name>entry_separator</Name>
<Desc>La cadena usada para separar valores múltiples para campos de
metadatos simples en registros de ProCite.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>//</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>SplitTextFile</Name>
<Desc>SplitTextFile es un conector para dividir archivos de entrada en
segmentos que se procesarán de manera individual. Este conector no debe
llamarse de manera directa. En cambio, si usted necesita procesar archivos
input que contienen varios documentos, debe escribir un conector con una
función de proceso que manejará uno de esos documentos habiéndolo
tomado de SplitTextFile. Vea ReferPlugin para un ejemplo.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>split_exp</Name>
<Desc>Una expresión Perl regular para separar la entrada de ficheros
en segmentos.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ReadTextFile</Name>
<Desc>Conector base para archivos de texto plano.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>input_encoding</Name>
<Desc>La codificación de los documentos de la fuente. Los documentos
se convertirán de estas codificaciones y se guardarán internamente como
utf8.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Use el algoritmo de categorización de texto para identificar
la codificación de cada fuente de documento automáticamente. Esto será
más lento que poniendo la codificación explícitamente pero
trabajará en donde más de una codificación se use dentro de la misma
colección.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>default_encoding</Name>
<Desc>Utilice esta codificación si -input_encoding está puesto en
‘auto’ y el algoritmo de categorización de texto no puede extraer
el código o extrae un código que Greenstone no soporte. Esta opción
puede tomar los mismos valores que -input_encoding.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>utf8</Default>
</Option>
<Option>
<Name>extract_language</Name>
<Desc>Identifica el idioma de cada documento y establece el 'lenguaje'
del metadato. Note que esto se hará automáticamente si -input_encoding
está en 'auto'.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>default_language</Name>
<Desc>Si Greenstone no identifica el lenguaje del documento, el elemento
del metadato se colocará en este valor. El valor predeterminado es 'en' (se
usan los símbolos de lenguaje ISO 639: en = inglés). Note que si
-input_encoding no está en 'auto' y -extract_language no está definido,
todos los documentos tendrán el metadato 'Lenguaje' ajustado a este
valor.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>en</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>AutoExtractMetadata</Name>
<Desc>Plugin base que agrupa todas las funcionalidades de extracción de
los conectores de extracción.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>first</Name>
<Desc>Lista separada por comas de los números de caracteres a extraer
desde el comienzo del texto para ser almacenados en campos de metadatos
llamados "FirstN". Por ejemplo los valores "3,5,7" permitirán la
extracción de los primeros 3, 5 y 7 caracteres en campos de metadatos
llamados "First3", "First5", "First7"</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>AcronymExtractor</Name>
<Desc>Conector asistente para la localización y el marcado de acrónimos
en el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_acronyms</Name>
<Desc>Extrae las siglas que contiene el texto y las coloca como
metadato.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>markup_acronyms</Name>
<Desc>Agregue el metadato de sigla en el texto del documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>KeyphraseExtractor</Name>
<Desc>Conector asociado para la generación de keyphrases desde el texto.
Utiliza el sistema de extracción de frases Kea.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_keyphrases</Name>
<Desc>Extraer automáticamente frases clave con Kea (opciones por
defecto).</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrases_kea4</Name>
<Desc>Extraer frases calve automáticamente con Kea 4.0
(configuración estándar). Kea 4.0 es una nueva versión de Kea que ha
sido desarrollada para la indización controlada de documentos del campo de
la agricultura.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>extract_keyphrase_options</Name>
<Desc>Opciones para extracción de frases clave con Kea. Por ejemplo:
mALIWEB - utilizar el modelo de extracción ALIWEB; n5 - extraer 5 frases
clave;, eGBK - utilizar codificación GBK.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
</Arguments>
<PlugInfo>
<Name>EmailAddressExtractor</Name>
<Desc>Conector asistente para el descubrimiento de direcciones de mail en el
texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_email</Name>
<Desc>Extrae direcciones de correo electrónico como metadatos.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>new_extract_email</Name>
<Desc></Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
</Arguments>
<PlugInfo>
<Name>DateExtractor</Name>
<Desc>Conector asistente para la extracción de información de fechas
históricas desde el texto.</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_historical_years</Name>
<Desc>Extrae información periódica de documentos históricos. Se
guarda como metadato con el documento. Existe una interfaz de búsqueda para
este metadato, que se puede incluir en la colección agregando la
expresión “format QueryInterface DateSearch” al fichero de
configuración de la colección.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>maximum_year</Name>
<Desc>La fecha histórica máxima a ser usada como metadato (en una
fecha referida la era común, como 1950).</Desc>
<Type>int</Type>
<Required>no</Required>
<CharactorLength>4</CharactorLength>
<Default>2015</Default>
</Option>
<Option>
<Name>maximum_century</Name>
<Desc>El número máximo de siglo que será extraído como
metadato histórico (por ej., 14 extraerá todas las referencias hasta el
siglo XIV).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>-1</Default>
</Option>
<Option>
<Name>no_bibliography</Name>
<Desc>No intente bloquear las fechas bibliográficas al extraer las
fechas históricas.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>GISExtractor</Name>
<Desc>Clase base paralela a BasPlug que soporta capacidades de GIS</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>extract_placenames</Name>
<Desc>Extraer del texto nombres de lugares y establecerlos como
metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>gazetteer</Name>
<Desc>Índice geográfico para extraer del texto nombres de lugares y
establecerlos como metadatos. Requiere la extensión GIS de Greenstone.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>place_list</Name>
<Desc>Al extractar ubicaciones, incluya la lista de nombres de lugares al
comienzo del documento. Requiere extensión de Greenstone a GIS.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>OAIMetadataXMLPlugin</Name>
<Desc>Versión de MetadataXMLPlugin que procesa archivos metadata.xml.
Adicionalmente, utiliza el campo "dc.Identifier" y extrae metadatos OAI desde
el servidor de OAI especificado (-oai_server_http_path)</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>oai_server_http_path</Name>
<Desc>Ruta HTTP al server de OAI - por ejemplo,
http://test.com/oai_server/oai.pl</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>metadata_prefix</Name>
<Desc>Prefijo de metadato OAI - por defecto es oai_dc.</Desc>
<Type>string</Type>
<Default>oai_dc</Default>
</Option>
<Option>
<Name>koha_mode</Name>
<Desc>Si está especificado, el plugin tratará de generar el
metadato oaiextracted.koharecordlink. Este metadato contiene el link al
documento Koha.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
</Arguments>
<PlugInfo>
<Name>MetadataXMLPlugin</Name>
<Desc>Conector que procesa archivos metadata.xml.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>metadata\.xml$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default>metadata\.xml$</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>BasePlugin</Name>
<Desc>La clase base para todos los plugins de importación.</Desc>
<Abstract>yes</Abstract>
<Inherits>no</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>no_blocking</Name>
<Desc>No hacer bloqueo de archivos. Cualquier archivo asociado (ej.
Imágenes en una página web) será agregado a la colección como
documentos separados.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>block_exp</Name>
<Desc>Los archivos que sean iguales a esta expresión regular serán
bloqueados para no pasarse a ningún otro plugin posterior del listado.</Desc>
<Type>regexp</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>store_original_file</Name>
<Desc>Grabar el documento original como un documento asociado. Note que
esto ya es así para documentos PDF, Word, etc. Esta opción solo es util
para plugins que no hacen copia del archivo original.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_ext</Name>
<Desc>Hace que los ficheros cuyos nombres contienen la misma parte
inicial que el documento procesado por el plugin y una extensión que figura
en la lista separada por comas que provee este argumento, sean asociados con el
documento que se está procesando en vez de ser manejados como una lista
separada.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>associate_tail_re</Name>
<Desc>Una expresión regular para cotejar con los nombres de archivos y
encontrar los archivos asociados.</Desc>
<Type>string</Type>
<Required>no</Required>
</Option>
<Option>
<Name>OIDtype</Name>
<Desc>El método a utilizar al generar los únicos identificadores
para cada documento.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Usar OIDType definido en import.pl</Desc>
</Value>
<Value>
<Name>hash</Name>
<Desc>Codifica los contenidos del fichero. Los identificadores del
documento serán los mismos cada vez que la colección sea importada.</Desc>
</Value>
<Value>
<Name>hash_on_ga_xml</Name>
<Desc>Aplica un HASH a los contenidos de los archivos XML de
Greenstone. Los identificadores de documentos serán los mismos cada vez que
la colección se importe mientras los metadatos no hayan cambiado.</Desc>
</Value>
<Value>
<Name>hash_on_full_filename</Name>
<Desc>Crear el HASH basado en el nombre completo del archivo dentro
de la carpeta 'import' (y no por su contenido). Permite hacer que los
identificadores de documentos sean más estables a lo largo de las
actualizaciones de software, aunque esto implica que ya no se detectará la
presencia de docuementos duplicados en la colección).</Desc>
</Value>
<Value>
<Name>assigned</Name>
<Desc>Usar el valor del elemento de metadato indicado por la
opción OIDmetadata; si no se especifica, se usa un hash para un documento
particular. Estos identificadores deben ser únicos. Identificadores
numéricos serán precedidos por una 'D'.</Desc>
</Value>
<Value>
<Name>incremental</Name>
<Desc>Usa un simple conteo de documentos. Significativamente más
rápido que "hash". pero no necesariamente asignará el mismo identificador
al mismo documento si la colección fuera reimportada.</Desc>
</Value>
<Value>
<Name>filename</Name>
<Desc>Usar el nombre del archivo (sin la extensión). Requiere que
todos los nombres de archivo en cualquiera de las subcarpetas presentes en
import sean únicos. Identificadores numéricos serán precedidos por la
letra 'D'.</Desc>
</Value>
<Value>
<Name>dirname</Name>
<Desc>Usar el nombre del directorio padre. Sólo debería haber
un documento por directorio, y todos los nombres de directorio deberían ser
únicos. Ej.: import/b13as/h15ef/page.html producirá Jh15ef como
identificador. Identificadores numéricos serán precedidos por una
'D'.</Desc>
</Value>
<Value>
<Name>full_filename</Name>
<Desc>Usar el nombre de archivo completo dentro de la carpeta
'import' como identificador del documento (los separadores de directorios y los
puntos serán sustituídos por - y _).</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>OIDmetadata</Name>
<Desc>Especifica el elemento de metadato que contiene el identificador
único de documento, se usa con -OIDtype=assigned, .</Desc>
<Type>metadata</Type>
<Required>no</Required>
<Default>dc.Identifier</Default>
</Option>
<Option>
<Name>no_cover_image</Name>
<Desc>No buscar un archivo prefijo.jpg (en el cual prefijo es el mismo
prefijo que el del archivo que está siendo procesado) para asociarlo como
imagen de portada.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>filename_encoding</Name>
<Desc>La codificación de los nombres de archivos de origen.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Detectar automáticamente la codificación del nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-language-analysis</Name>
<Desc>Auto detectar la codificación analizando el nombre de
archivo.</Desc>
</Value>
<Value>
<Name>auto-filesystem-encoding</Name>
<Desc>Auto detectar la codificación del nombre de archivo usando
la codificación del filesystem.</Desc>
</Value>
<Value>
<Name>auto-fl</Name>
<Desc>Utiliza la codificación del filesystem y luego análisis
de idioma para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>auto-lf</Name>
<Desc>Utilizar análisis de idioma y luego codificación del
filesystem para detectar la codificación del nombre de archivo.</Desc>
</Value>
<Value>
<Name>ascii</Name>
<Desc>ASCII plano de 7 bits. Éste puede resultar más rápido
que usando el iso_8859_1. Tenga cuidado con usar esto en una colección de
documentos que pueden contener caracteres no comprendidos en el conjunto ASCII
simple (por ejemplo documentos en Alemán o Francés que contengan
acentos), mejor utilice el iso_8859_1.</Desc>
</Value>
<Value>
<Name>utf8</Name>
<Desc>Ya sea Utf8 o unicode—detectada automáticamente</Desc>
</Value>
<Value>
<Name>unicode</Name>
<Desc>Sólo unicode.</Desc>
</Value>
<Value>
<Name>iso_8859_6</Name>
<Desc>Arabic</Desc>
</Value>
<Value>
<Name>gb</Name>
<Desc>Chinese Simplified (GB)</Desc>
</Value>
<Value>
<Name>big5</Name>
<Desc>Chinese Traditional (Big5)</Desc>
</Value>
<Value>
<Name>koi8_r</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>iso_8859_5</Name>
<Desc>Cyrillic</Desc>
</Value>
<Value>
<Name>koi8_u</Name>
<Desc>Cyrillic (Ukrainian)</Desc>
</Value>
<Value>
<Name>dos_437</Name>
<Desc>DOS codepage 437 (US English)</Desc>
</Value>
<Value>
<Name>dos_850</Name>
<Desc>DOS codepage 850 (Latin 1)</Desc>
</Value>
<Value>
<Name>dos_852</Name>
<Desc>DOS codepage 852 (Central European)</Desc>
</Value>
<Value>
<Name>dos_866</Name>
<Desc>DOS codepage 866 (Cyrillic)</Desc>
</Value>
<Value>
<Name>iso_8859_7</Name>
<Desc>Greek</Desc>
</Value>
<Value>
<Name>iso_8859_8</Name>
<Desc>Hebrew</Desc>
</Value>
<Value>
<Name>iscii_de</Name>
<Desc>ISCII Devanagari</Desc>
</Value>
<Value>
<Name>euc_jp</Name>
<Desc>Japanese (EUC)</Desc>
</Value>
<Value>
<Name>shift_jis</Name>
<Desc>Japanese (Shift-JIS)</Desc>
</Value>
<Value>
<Name>korean</Name>
<Desc>Korean (Unified Hangul Code - i.e. a superset of EUC-KR)</Desc>
</Value>
<Value>
<Name>iso_8859_1</Name>
<Desc>Latin1 (western languages)</Desc>
</Value>
<Value>
<Name>iso_8859_15</Name>
<Desc>Latin15 (revised western)</Desc>
</Value>
<Value>
<Name>iso_8859_2</Name>
<Desc>Latin2 (central and eastern european languages)</Desc>
</Value>
<Value>
<Name>iso_8859_3</Name>
<Desc>Latin3</Desc>
</Value>
<Value>
<Name>iso_8859_4</Name>
<Desc>Latin4</Desc>
</Value>
<Value>
<Name>iso_8859_9</Name>
<Desc>Turkish</Desc>
</Value>
<Value>
<Name>windows_1250</Name>
<Desc>Windows codepage 1250 (WinLatin2)</Desc>
</Value>
<Value>
<Name>windows_1251</Name>
<Desc>Windows codepage 1251 (WinCyrillic)</Desc>
</Value>
<Value>
<Name>windows_1252</Name>
<Desc>Windows codepage 1252 (WinLatin1)</Desc>
</Value>
<Value>
<Name>windows_1253</Name>
<Desc>Windows codepage 1253 (WinGreek)</Desc>
</Value>
<Value>
<Name>windows_1254</Name>
<Desc>Windows codepage 1254 (WinTurkish)</Desc>
</Value>
<Value>
<Name>windows_1255</Name>
<Desc>Windows codepage 1255 (WinHebrew)</Desc>
</Value>
<Value>
<Name>windows_1256</Name>
<Desc>Windows codepage 1256 (WinArabic)</Desc>
</Value>
<Value>
<Name>windows_1257</Name>
<Desc>Windows codepage 1257 (WinBaltic)</Desc>
</Value>
<Value>
<Name>windows_1258</Name>
<Desc>Windows codepage 1258 (Vietnamese)</Desc>
</Value>
<Value>
<Name>windows_874</Name>
<Desc>Windows codepage 874 (Thai)</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
<Option>
<Name>smart_block</Name>
<Desc>SUSTITUIDO. Bloquear archivos en una forma más inteligente que
simplemente examinando sus nombres.</Desc>
<Type>flag</Type>
<Required>no</Required>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>file_rename_method</Name>
<Desc>El método a utilizarse para renombrar la copia de los archivos
importados y asociados.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>url</Name>
<Desc>Usar codificación de URL al renombrar archivos importados y
asociados.</Desc>
</Value>
<Value>
<Name>base64</Name>
<Desc>Usar codificación base64 para renombrar archivos importados
y asociados.</Desc>
</Value>
<Value>
<Name>none</Name>
<Desc>No renombrar archivos importados y asociados.</Desc>
</Value>
</List>
<Default>url</Default>
</Option>
</Arguments>
</PlugInfo>
</PlugInfo>
</PlugInfo>
<PlugInfo>
<Name>PagedImagePlugin</Name>
<Desc>Plugin para documentos hechos con secuencias de imágenes, con texto
opcional de OCR para cada imagen. Procesa ficheros .item qye listan la
secuencia de ficheros de imágenes y texto, y proveen los metadatos.</Desc>
<Abstract>no</Abstract>
<Inherits>yes</Inherits>
<Processes>\.item$</Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>process_exp</Name>
<Desc>Una expresión Perl regular para comprobar contra nombres de
ficheros que se procesarán por este plugin. Por ej., usando '(? i). html? \
$' aparecerán todos los documentos con terminación. htm .html (no es
sensible a mayúsculas/minúsculas).</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>\.item$</Default>
</Option>
<Option>
<Name>title_sub</Name>
<Desc>Expresión de sustitución para modificar una cadena almacenada
como Título. Usada, por ejemplo, en PDFPlugin para eliminar "Página 1",
etc de un texto usado como título.</Desc>
<Type>string</Type>
<Default></Default>
</Option>
<Option>
<Name>headerpage</Name>
<Desc>Añadir una cabecera de página de nivel principal (que no
contenga imagen) a cada documento.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>processing_tmp_files</Name>
<Desc>Marca interna, fijada por los plugins conversores para indicar que
están procesando un archivo tmp.</Desc>
<Type>flag</Type>
<HiddenGLI>yes</HiddenGLI>
</Option>
<Option>
<Name>documenttype</Name>
<Desc>Establecer el tipo de documento (usado para despliegue)</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>auto</Name>
<Desc>Configurar automáticamente el tipo de documento basado en el
formato del archivo .item. Utiliza 'paged' para documentos que contienen una
secuencia simple de páginas, y 'hierarchy' para documentos con una
estructura interna (por ej. que contienen agrupamiento de páginas definido
en el archivo .item con formato XML)</Desc>
</Value>
<Value>
<Name>paged</Name>
<Desc>Los documentos tipo Paged tienen una secuencia de páginas
lineal y no poseen estructura interna. Se mostrarán con las flechas
'siguiente' y 'anterior' y la opción 'Ir a la página X'.</Desc>
</Value>
<Value>
<Name>hierarchy</Name>
<Desc>Los documentos jerárquicos tienen una estructura interna y
se mostrarán con una tabla de contenidos</Desc>
</Value>
</List>
<Default>auto</Default>
</Option>
</Arguments>
<PlugInfo>
<Name>ImageConverter</Name>
<Desc>Este plugin procesa las imágenes, agregando los metadatos
básicos</Desc>
<Abstract>yes</Abstract>
<Inherits>yes</Inherits>
<Processes></Processes>
<Blocks></Blocks>
<Explodes>no</Explodes>
<SourceReplaceable>no</SourceReplaceable>
<Arguments>
<Option>
<Name>create_thumbnail</Name>
<Desc>Si se configura como true, crea una versión miniatura de cada
imagen y agrega los metadatos Thumb, ThumbType, thumbicon, ThumbWidth,
ThumbHeight.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>true</Default>
</Option>
<Option>
<Name>thumbnailsize</Name>
<Desc>Realiza iconos pequeños tamaño nxn.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>100</Default>
</Option>
<Option>
<Name>thumbnailtype</Name>
<Desc>Realiza iconos pequeños en el formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>gif</Default>
</Option>
<Option>
<Name>noscaleup</Name>
<Desc>No sobreponga las imágenes pequeñas al hacer thumbnails
.</Desc>
<Type>flag</Type>
<Required>no</Required>
</Option>
<Option>
<Name>create_screenview</Name>
<Desc>Si se configura como true, crea una imagen tamaño pantalla y
asigna los metadatos Screen, ScreenType, screenicon, ScreenWidth,
ScreenHeight.</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>true</Default>
</Option>
<Option>
<Name>screenviewsize</Name>
<Desc>Producir imágenes "screenview" de tamaño nxn.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>500</Default>
</Option>
<Option>
<Name>screenviewtype</Name>
<Desc>Producir imágenes "screenview" en formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default>jpg</Default>
</Option>
<Option>
<Name>converttotype</Name>
<Desc>Convertir la imagen principal al formato 's'.</Desc>
<Type>string</Type>
<Required>no</Required>
<Default></Default>
</Option>
<Option>
<Name>minimumsize</Name>
<Desc>Ignore las imágenes menores que n bytes.</Desc>
<Type>int</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>100</Default>
</Option>
<Option>
<Name>apply_aspectpad</Name>
<Desc>{ImageConverter.apply_aspectpad}</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>true</Name>
<Desc>verdadero</Desc>
</Value>
<Value>
<Name>false</Name>
<Desc>falso</Desc>
</Value>
</List>
<Default>false</Default>
</Option>
<Option>
<Name>aspectpad_ratio</Name>
<Desc>{ImageConverter.aspectpad_ratio}</Desc>
<Type>string</Type>
<Required>no</Required>
<Range>1,</Range>
<Default>2</Default>
</Option>
<Option>
<Name>aspectpad_mode</Name>
<Desc>{ImageConverter.aspectpad_mode}</Desc>
<Type>enum</Type>
<Required>no</Required>
<List>
<Value>
<Name>al</Name>
<Des