22 de octubre de 2020
- Autor: Ayala Hernández, Daniel
- Titulo: On Data Engineering and Knowledge Graphs -A holistic, smarter approach to data enrichment.
- Directores: David Ruiz Cortés, Inmaculada Hernández Salmerón
- Sinopsis: La tesis realizada ha consistido en el desarrollo de métodos y herramientas para el enriquecimiento de grafos de conocimiento mediante integración de datos y completado de relaciones. Dichos métodos y herramientas hacen uso de técnicas de ingeniería de datos y aprendizaje supervisado.
En lo referente a la integración de información, se han abordado los problemas específicos de “semantic labelling” (asignación de etiquetas a elementos de información estructurada) y “property matching” (identificación de propiedades relacionadas en fuentes de datos diferentes).
En ambos casos, las contribuciones estuvieron basadas en el uso de características novedosas al entrenar clasificadores:
- TAPON (nuestra propuesta de semantic labelling) etiqueta de forma iterativa para calcular características adicionales usando las etiquetas preliminares.
- LEAPME (nuestra propuesta de property matching) usa características relacionadas con las instancias de las propiedades y embeddings de palabras precalculados.
En lo referente al completado de relaciones en grafos, se ha desarrollado AYNEC, una suite de herramientas que busca establecer estándares y buenas prácticas en la evaluación de técnicas de completado, incluyendo tanto la generación de datasets como el cálculo de métricas.
- Departamento: Lenguajes y Sistemas Informáticos
- idUS: https://idus.us.es/handle/11441/103713