Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2013-06-10T13:09:30Z
dc.date.available 2013-06-10T13:09:30Z
dc.date.issued 2013-06-10
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/27136
dc.description.abstract La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, programas para extracción de datos de la web, cumplen tal función, y pueden ser generados, mediante herramientas, en forma automática o desarrollados en forma artesanal (utilizando los lenguajes de programación python o perl, por ejemplo). Los wrappers son los encargados de transformar la información semi-estructurada (presente en un sitio web) en información estructurada, a través del lenguaje XML (eXtensible Markup Language). El carácter dinámico de los sitios web posiblemente degrade la calidad de la información extraída por los wrappers, programas que trabajan en base a ciertos criterios, como ser color, posición en la página, fuente, tags, entre otros; los cuales pueden cambiar por el dinamismo propio del sitio. Los resultados del presente trabajo, van a permitir establecer un criterio de evaluación y comparación de las calidad de los datos extraídos de un sitio web, a medida que este presenta cambio y/o modificaciones. es
dc.format.extent 185-188 es
dc.language es es
dc.subject informática y tratamiento de datos es
dc.subject extracción de datos es
dc.subject datos semi-estructurados es
dc.subject calidad de datos es
dc.subject medidas de calidad es
dc.subject wrappers es
dc.title Evaluación de la calidad de la Información extraída por wrappers, de un sitio web es
dc.type Objeto de conferencia es
sedici.creator.person Vargas, Alejandro es
sedici.creator.person Sánchez Rivero, David es
sedici.creator.person Valdéz, Ángel es
sedici.creator.person Bernechea, Miguel es
sedici.creator.person Castillo, Natalia es
sedici.creator.person Colqui, Reinaldo es
sedici.description.note Eje: Bases de Datos y Minería de Datos es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Red de Universidades con Carreras en Informática (RedUNCI) es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
sedici.date.exposure 2013-04
sedici.relation.event XV Workshop de Investigadores en Ciencias de la Computación es
sedici.description.peerReview peer-review es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)