Busque entre los 155949 recursos disponibles en el repositorio
Mostrar el registro sencillo del ítem
dc.date.accessioned | 2013-06-10T13:09:30Z | |
dc.date.available | 2013-06-10T13:09:30Z | |
dc.date.issued | 2013-06-10 | |
dc.identifier.uri | http://sedici.unlp.edu.ar/handle/10915/27136 | |
dc.description.abstract | La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, programas para extracción de datos de la web, cumplen tal función, y pueden ser generados, mediante herramientas, en forma automática o desarrollados en forma artesanal (utilizando los lenguajes de programación python o perl, por ejemplo). Los wrappers son los encargados de transformar la información semi-estructurada (presente en un sitio web) en información estructurada, a través del lenguaje XML (eXtensible Markup Language). El carácter dinámico de los sitios web posiblemente degrade la calidad de la información extraída por los wrappers, programas que trabajan en base a ciertos criterios, como ser color, posición en la página, fuente, tags, entre otros; los cuales pueden cambiar por el dinamismo propio del sitio. Los resultados del presente trabajo, van a permitir establecer un criterio de evaluación y comparación de las calidad de los datos extraídos de un sitio web, a medida que este presenta cambio y/o modificaciones. | es |
dc.format.extent | 185-188 | es |
dc.language | es | es |
dc.subject | informática y tratamiento de datos | es |
dc.subject | extracción de datos | es |
dc.subject | datos semi-estructurados | es |
dc.subject | calidad de datos | es |
dc.subject | medidas de calidad | es |
dc.subject | wrappers | es |
dc.title | Evaluación de la calidad de la Información extraída por wrappers, de un sitio web | es |
dc.type | Objeto de conferencia | es |
sedici.creator.person | Vargas, Alejandro | es |
sedici.creator.person | Sánchez Rivero, David | es |
sedici.creator.person | Valdéz, Ángel | es |
sedici.creator.person | Bernechea, Miguel | es |
sedici.creator.person | Castillo, Natalia | es |
sedici.creator.person | Colqui, Reinaldo | es |
sedici.description.note | Eje: Bases de Datos y Minería de Datos | es |
sedici.subject.materias | Ciencias Informáticas | es |
sedici.description.fulltext | true | es |
mods.originInfo.place | Red de Universidades con Carreras en Informática (RedUNCI) | es |
sedici.subtype | Objeto de conferencia | es |
sedici.rights.license | Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) | |
sedici.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ | |
sedici.date.exposure | 2013-04 | |
sedici.relation.event | XV Workshop de Investigadores en Ciencias de la Computación | es |
sedici.description.peerReview | peer-review | es |