Grupo G.D.A.

Contamos Contigo

Vie, 24.11.2017

ExtractPDF, cómo extraer imágenes y textos de un fichero PDF

extractpdf

Los ficheros PDF (Portable Document Format) son de uso diario para muchas personas, tanto en el trabajo como en los ratos de ocio. Informes, revistas, libros digitales y todo tipo de documentos suelen estar en ese formato de Adobe. La aplicación lectora Adobe Acrobat Reader es gratuita y se puede instalar en ordenadores, smartphones y tabletas, pero a menudo no basta con poder leerlos. Muchas veces interesa poder extraer imágenes y textos, e incluso tipos de letra. Existen diversas herramientas disponibles para conseguirlo, ya sea en forma de aplicaciones o de servicios en línea; muchas son gratis. Entre las herramientas gratuitas destaca especialmente ExtractPDF, porque es muy completo; no sólo sirve para sacar textos, tipos de letra e imágenes de ese formato de archivo, sino que además es posible extraer información adicional como los metadatos asociados.

ExtractPDF funciona por Internet. El usuario puede realizar la operación de dos maneras. La primera es subir el fichero PDF al sitio, y la segunda consiste en introducir la dirección de Internet (URL) de donde se encuentra alojado el archivo que desea tratar. La interfaz es muy simple y está disponible en dos idiomas: inglés y alemán. No hace falta registrase para utilizarlo, ni tampoco hace falta realizar ninguna clases de verificación por correo electrónico. El servicio no accede al contenido de los archivos subidos, y borran los ficheros después de terminar de procesarlos.

extractpdf

Si el usuario se decanta por subir el fichero, el tamaño máximo del PDF está limitado a 10 MB (megabytes). Una vez subido el PDF, el usuario debe hacer clic en el botón de Enviar fichero, y después de muy poco tiempo obtiene los resultados. En la página que recoge los resultados del proceso hay cuatro apartados: imágenes, textos, fuentes y metadatos. El usuario sólo debe elegir la pestaña correspondiente para descargar los contenidos, por ejemplo, la de imágenes. Otra de sus ventajas es que las imágenes, los textos y demás se bajan comprimidos en ZIP, para que ocupen menos espacio y la operación tarde poco.

La herramienta ExtractPDF extrae las imágenes originales empleadas en el PDF. Sin embargo, ignora cualquier transformación posterior como las rotaciones o las inversiones de color. Con respecto a las fuentes, el servicio advierte que los tipos de letra extraídos son aquellos que figuran dentro del documento PDF original. Esto significa que si ese fichero original no contenía la letra “Q”, esa letra no aparecerá dentro de los resultados.

El servicio ExtractPDF es gratis, y no existe ninguna limitación respecto al número de ficheros que se pueden procesar al día. Se financia parcialmente con publicidad; sirven anuncios en su página. Finalmente, existen otras herramientas alternativas que también son gratis, aunque no tan completas, como Extract PDF Images, PDF Text Extractor o iWeSoft PDF Image Extractor, entre otras.

Éste es el enlace al sitio de ExtractPDF.

 

Fuente: tuexperto

Contador de Visitas

637712
Hoy Hoy 25
Ayer Ayer 21
Esta semana Esta semana 128
Este mes Este mes 1087
Total de Visitas Total de Visitas 637712
Día con más visitantes 02-08-2015 : 457

Gracias por su visita

¿Quién está en línea?

Hay 6 invitados y ningún miembro en línea