Normalización e identificación de objetos duplicados sobre contenido extraído de la web

Mastronardi, Gonzalo

Buscar material

Busque entre los 171119 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Normalización e identificación de objetos duplicados sobre contenido extraído de la web

Autor: Mastronardi, Gonzalo

2024

Tipo de documento: Tesis de grado

Resumen

La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.

Notas

Codirector: Sergio Firmenich

Información de la Tesis

Director: Fernández, Alejandro

Fecha de exposición: 18 de abril de 2024

Fecha de publicación: 2024

Grado alcanzado: Licenciado en Sistemas

Institución otorgante: Universidad Nacional de La Plata

Información general

Idioma del documento: Español

Institución de origen: Facultad de Informática

Palabras claves: Web semántica ; Información ; Extracción de objetos ; Calidad de datos ; Framework ; Normalización de objetos ; Identificación de duplicados ; Dbpedia

Materias: Informática

Descargar archivos

Documento completo
Descargar archivo (699.2Kb) - PDF

BASE

GoogleScholar

Creado el: 25 de abril de 2024

Disponible en SEDICI desde: 25 de abril de 2024

Por favor, utilice uno de estos identificadores(URI) para citar o enlazar este ítem:

http://sedici.unlp.edu.ar/handle/10915/165308

Mostrar el registro completo del ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Facultad de Informática → Tesis

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)

Iniciar sesión