Upload resources

Upload your works to SEDICI to increase its visibility and improve its impact

 

Show simple item record

dc.date.accessioned 2020-03-09T18:31:38Z
dc.date.available 2020-03-09T18:31:38Z
dc.date.issued 2019
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/90527
dc.description.abstract El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedades y tasas de errores, intervalos de detección más largos y fallos silenciosos. Se proyecta que, en sistemas de exa-escala, los errores ocurran varias veces al día y se propaguen para generar desde caídas de procesos hasta corrupciones de resultados debidas a fallos no detectados. En este trabajo se describe la utilización de SEDAR, una herramienta que permite detectar fallos transitorios en aplicaciones MPI, y recuperar automáticamente las ejecuciones, posibilitando su finalización con resultados fiables. La detección se basa en replicación de procesamiento y monitorización del envío de mensajes y del cómputo local, mientras que la recuperación se logra utilizando múltiples checkpoints de capa de sistema. El estudio del comportamiento de SEDAR en presencia de fallos, inyectados en distintos momentos durante la ejecución, permite evaluar su desempeño y caracterizar el overhead asociado a su utilización. Las posibilidades de configurar el modo de uso, adaptándolo a los requerimientos de cobertura y máximo overhead permitido de un sistema particular, hacen de SEDAR una metodología factible y viable para la tolerancia a fallos transitorios en sistemas de HPC. es
dc.format.extent 170-182 es
dc.language es es
dc.subject Detección de fallos transitorios es
dc.subject Recuperación automática es
dc.subject Corrupción silenciosa de datos es
dc.subject Aplicaciones de HPC es
dc.subject Inyección de fallos es
dc.title SEDAR: Detectando y recuperando fallos transitorios en aplicaciones de HPC es
dc.type Objeto de conferencia es
sedici.identifier.isbn 978-987-688-377-1 es
sedici.creator.person Montezanti, Diego Miguel es
sedici.creator.person Rucci, Enzo es
sedici.creator.person Rexachs del Rosario, Dolores es
sedici.creator.person Luque Fadón, Emilio es
sedici.creator.person Naiouf, Marcelo es
sedici.creator.person De Giusti, Armando Eduardo es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Red de Universidades con Carreras en Informática es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
sedici.date.exposure 2019-10
sedici.relation.event XXV Congreso Argentino de Ciencias de la Computación (CACIC) (Universidad Nacional de Río Cuarto, Córdoba, 14 al 18 de octubre de 2019) es
sedici.description.peerReview peer-review es
sedici.relation.isRelatedWith http://sedici.unlp.edu.ar/handle/10915/90359 es


Download Files

This item appears in the following Collection(s)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Except where otherwise noted, this item's license is described as Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)