Generación automática de una base de datos desde documentos de la web

Motz, Regina; Wonsever, Dina; Perelló, Fernando; Ferreiro, Jaime

Buscar material

Busque entre los 168781 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Red de Universidades con Carreras en Informática (RedUNCI)
→
Eventos
→
CACIC
→
CACIC 2000

Generación automática de una base de datos desde documentos de la web

Autores: Motz, Regina | Wonsever, Dina | Perelló, Fernando | Ferreiro, Jaime

2000

Tipo de documento: Objeto de conferencia

Resumen

El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurísticas para la interpretación de títulos y tablas. Mediante este mecanismo se construye automáticamente un mapeo entre elementos de un documento HTML y las entidades del dominio del usuario. Utilizando este mapeo, se transfiere la información extraída de la página Web a una base de datos local.

Notas

Área: Ingeniería de Software - Bases de Datos

Información general

Fecha de exposición: octubre 2000

Fecha de publicación: octubre 2000

Idioma del documento: Español

Evento: VI Congreso Argentino de Ciencias de la Computación

Institución de origen: Red de Universidades con Carreras en Informática (RedUNCI)

Palabras claves: Base de Datos ; documento HTML ; mapeo ; extracción de información

Materias: Ciencias Informáticas

Descargar archivos

Documento completo
Descargar archivo (209.6Kb) - PDF

BASE

GoogleScholar

Creado el: 2 de noviembre de 2012

Disponible en SEDICI desde: 2 de noviembre de 2012

Por favor, utilice uno de estos identificadores(URI) para citar o enlazar este ítem:

http://sedici.unlp.edu.ar/handle/10915/23569

Mostrar el registro completo del ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

CACIC → CACIC 2000

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Iniciar sesión