Upload resources

Upload your works to SEDICI to increase its visibility and improve its impact

 

Show simple item record

dc.date.accessioned 2010-05-31T14:51:48Z
dc.date.available 2010-05-31T03:00:00Z
dc.date.issued 2009
dc.identifier.uri http://hdl.handle.net/10915/5555
dc.description.abstract Se presenta una plataforma de recolección destinada a relacionar y unificar información disponible en distintos lugares de la Web-que siguen diferentes convenciones-para crear un repositorio temático que puedan navegar los usuarios. La plataforma será usada en el Servicio de Difusión de la Creación Intelectual (SeDiCI) y utiliza de manera combinada ontologías y tesauros para brindar información mejor clasificada. Actualmente, la información está diseminada en recursos de la Web y los motores de búsqueda tradicionales le devuelven al usuario listas rankeadas sin proveer ninguna relación semántica entre documentos. Los usuarios pasan gran cantidad de tiempo para vincular unos documentos con otros y saber cuáles atacan el dominio completo del problema; recién al localizar las semejanzas y las diferencias entre fragmentos de información éstas se trasladan a su trabajo y sirven para la creación de nuevo conocimiento. La plataforma propuesta separa los módulos de funcionamiento de los diferentes dominios de interés (temas) para permitir su utilización en distintas áreas de conocimiento. El desarrollo incluye dos agentes que recorren las URLs almacenadas en una base de datos (uno responsable de poblar una ontología y otro de obtener URLs relacionadas), un módulo capaz de reconocer las páginas marcadas, interpretar las etiquetas y proveer las reglas para extraer la información y guardarla en un fichero RDF; tras esta etapa se aplica una homogeneización y la información así transformada se clasifica en función de una ontología de dominio. La plataforma vuelve más eficientes los procesos de extracción automática y búsqueda de información en fuentes heterogéneas que representan los mismos conceptos siguiendo distintas convenciones. es
dc.description.abstract Presentation of a web collection platform designed to relate and unify information available on different standard web sources with a view to creating a user-browseable thematic repository. The platform will be used at the Servicio de Difusión de la Creación Intelectual (SeDiCI) [Intellectual Creation Diffusion Service] combined with ontologies and thesaurus to provide improved data sorting. Data is currently spread on web resources and traditional search engines return ranked lists with no semantic relation among documents. Users have to spend a great deal of time relating documents and trying to figure out which ones fully address the issue domain. It is only after locating similarities and differences that information fragments are applied to the user's work, enabling knowledge creation. The proposed platform sorts out the different theme domain functioning modules to allow their use in various knowledge areas. Development includes two agents that searches data base stored URLs, one is capable of identifying bookmarked pages, interpreting labels and providing rules for extracting information and storing it in a RDF data file; on the other hand, the other agent is in charge of getting related URLs from the given one. After this stage, homogenization is applied and transformed information is sorted out according to domain ontologies. The platform allows for more efficient automatic extraction processes and information search among heterogeneous sources that represent the same concepts using different standards. en
dc.format.extent 12 p. es
dc.language es es
dc.title Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a la organización de un repositorio semántico en SeDiCI: preliminares es
dc.type Objeto de conferencia es
sedici.creator.person De Giusti, Marisa Raquel es
sedici.creator.person Sobrado, Ariel es
sedici.creator.person Vosou, Agustín es
sedici.creator.person Villarreal, Gonzalo Luján es
sedici.subject.materias Informática es
sedici.subject.materias Bibliotecología es
sedici.subject.eurovoc tecnología de la información es
sedici.subject.keyword SeDiCI; repositorio semántico; ontologías y tesauros es
sedici.description.fulltext true es
mods.originInfo.place Servicio de Difusión de la Creación Intelectual (SeDiCI) es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution 3.0 Unported (CC BY 3.0)
sedici.rights.uri http://creativecommons.org/licenses/by/3.0/
sedici.date.exposure 2009
sedici.relation.event III Conferencia Internacional de Biblioteca Digital y Educación a Distancia es
sedici.description.peerReview peer-review es
sedici2003.identifier ARG-UNLP-DIS-0000001623 es


Files in this item

This item appears in the following Collection(s)

Creative Commons Attribution 3.0 Unported (CC BY 3.0) Except where otherwise noted, this item's license is described as Creative Commons Attribution 3.0 Unported (CC BY 3.0)