Mejora y refactorización de una biblioteca de código abierto para la extracción de metadatos en documentos PDF
Metadatos
Mostrar el registro completo del ítemcomunitat-uji-handle:10234/158176
comunitat-uji-handle2:10234/71324
comunitat-uji-handle3:10234/107061
comunitat-uji-handle4:
TFG-TFMMetadatos
Título
Mejora y refactorización de una biblioteca de código abierto para la extracción de metadatos en documentos PDFAutoría
Tutor/Supervisor; Universidad.Departamento
Gracia Luengo, Isabel; Universitat Jaume I. Departament de Llenguatges i Sistemes Informàtics; Diago García, ManuelFecha de publicación
2019-07Editor
Universitat Jaume IResumen
En este documento se describe el análisis, desarrollo e implementación del proyecto
de final de grado del grado de Ingeniería Informática, el cual ha tenido lugar durante la
estancia en prácticas en Irene Solutions ... [+]
En este documento se describe el análisis, desarrollo e implementación del proyecto
de final de grado del grado de Ingeniería Informática, el cual ha tenido lugar durante la
estancia en prácticas en Irene Solutions SL, localizada en Burriana.
El proyecto nace de la necesidad de mejorar PdfTagger, una de las librerías con las
que trabajan en la empresa. Dicha librería permite a partir de un documento PDF y un
conjunto de metadatos, aprender la estructura de un archivo PDF para posteriormente extraer
metadatos de documentos PDF con la misma estructura.
Para poder llevar a cabo este trabajo, se ha realizado un estudio del entorno ya
existente en la empresa, así como de las distintas herramientas empleadas.
Con la implementación de algunas de las mejoras detalladas en el documento se ha
conseguido aumentar el porcentaje de metadatos extraídos correctamente con respecto al
estado inicial. [-]
Palabras clave / Materias
Grau en Enginyeria Informàtica | Grado en Ingeniería Informática | Bachelor's Degree in Computer Engineering | documentos PDF | extracción de metadatos | librería PdfTagger | librería iText | C# | expresiones regulares | PDF documents | metadata extraction | PdfTagger library | iText library | regular expressions
Descripción
Treball Final de Grau en Enginyeria Informàtica. Codi: EI1054. Curs acadèmic: 2018/2019
Tipo de documento
info:eu-repo/semantics/bachelorThesisDerechos de acceso
info:eu-repo/semantics/openAccess
Aparece en las colecciones
El ítem tiene asociados los siguientes ficheros de licencia: