Busque entre los 168361 recursos disponibles en el repositorio
Mostrar el registro sencillo del ítem
dc.date.accessioned | 2012-11-02T18:22:01Z | |
dc.date.available | 2012-11-02T18:22:01Z | |
dc.date.issued | 2000-10 | |
dc.identifier.uri | http://sedici.unlp.edu.ar/handle/10915/23569 | |
dc.description.abstract | El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurísticas para la interpretación de títulos y tablas. Mediante este mecanismo se construye automáticamente un mapeo entre elementos de un documento HTML y las entidades del dominio del usuario. Utilizando este mapeo, se transfiere la información extraída de la página Web a una base de datos local. | es |
dc.language | es | es |
dc.subject | Base de Datos | es |
dc.subject | documento HTML | es |
dc.subject | mapeo | es |
dc.subject | extracción de información | es |
dc.title | Generación automática de una base de datos desde documentos de la web | es |
dc.type | Objeto de conferencia | es |
sedici.creator.person | Motz, Regina | es |
sedici.creator.person | Wonsever, Dina | es |
sedici.creator.person | Perelló, Fernando | es |
sedici.creator.person | Ferreiro, Jaime | es |
sedici.description.note | Área: Ingeniería de Software - Bases de Datos | es |
sedici.subject.materias | Ciencias Informáticas | es |
sedici.description.fulltext | true | es |
mods.originInfo.place | Red de Universidades con Carreras en Informática (RedUNCI) | es |
sedici.subtype | Objeto de conferencia | es |
sedici.rights.license | Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) | |
sedici.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ | |
sedici.date.exposure | 2000-10 | |
sedici.relation.event | VI Congreso Argentino de Ciencias de la Computación | es |
sedici.description.peerReview | peer-review | es |