Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2024-11-27T13:59:15Z
dc.date.available 2024-11-27T13:59:15Z
dc.date.issued 2024-10
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/173739
dc.description.abstract Despite recent advances in Large Language Models in text processing. Sign Language Recognition (SLR) remains an unresolved task. This is, in part, due to limitations in the available data. In this paper, we investigate combining ID convolutions with transformer layers to capture local features and global interactions in a low-parameter SLR model. We experimented using multiple data augmentation and regularization techniques to categorize signs of the French Belgian Sign Language. We achieved a top-1 accuracy of 42.7% and a top-10 accuracy of 81.9% in 600 different signs. This model is competitive with the current state of the art while using a significantly lower number of parameters. en
dc.description.abstract A pesar de los avances recientes en grandes modelos de lenguaje para el procesamiento de texto, el Reconocimiento de Lenguas de Señas (SLR por sus siglas en inglés) aún es una tarea sin resolver. Esto es, en parte, debido a las limitaciones en los datos disponibles. En este artículo, investigamos cómo combinar convoluciones Id con capas transformer para capturar las características locales y las interacciones globales utilizando un modelo de SLR de pocos parámetros. Experimentamos usando múltiples técnicas de aumento de datos y regularización para categorizar señas de la lengua de señas belga-francesa. Como resultado, obtuvimos una exactitud top-1 de 42.7% y top-10 de 81.9% en 600 señas diferentes. Este modelo es competitivo con el estado del arte actual, utilizando una cantidad significativamente menor de parámetros. es
dc.format.extent 104-110 es
dc.language en es
dc.subject deep learning es
dc.subject sequence classification es
dc.subject sign language recognition es
dc.subject unbalanced data es
dc.subject aprendizaje profundo es
dc.subject clasificación de sequencias es
dc.subject reconocimiento de lenguas de señas es
dc.subject datos desbalanceados es
dc.title ConvAtt Network: a low parameter approach for sign language recognition en
dc.type Articulo es
sedici.identifier.other https://doi.org/10.24215/16666038.24.e10 es
sedici.identifier.issn 1666-6038 es
sedici.creator.person Ríos, Gastón Gustavo es
sedici.creator.person Dal Bianco, Pedro Alejandro es
sedici.creator.person Ronchetti, Franco es
sedici.creator.person Ponte Ahón, Santiago Andrés es
sedici.creator.person Stanchi, Oscar Agustín es
sedici.creator.person Hasperué, Waldo es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Facultad de Informática es
sedici.subtype Articulo es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
sedici.description.peerReview peer-review es
sedici.relation.journalTitle Journal of Computer Science & Technology es
sedici.relation.journalVolumeAndIssue vol. 24, no. 2 es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)