Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2024-09-26T17:55:40Z
dc.date.available 2024-09-26T17:55:40Z
dc.date.issued 2023-09-27
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/170756
dc.description.abstract El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados. es
dc.format.extent 458-459 es
dc.language es es
dc.subject aprendizaje automático es
dc.subject redes neuronales es
dc.subject sistemas inteligentes e IA es
dc.subject visión por computadora es
dc.subject generación de imagenes es
dc.subject artificial inteligence es
dc.subject artificial neural networks es
dc.subject computer vision es
dc.subject machine learning es
dc.subject image generation es
dc.title Generación de imágenes con técnicas de aprendizaje automático: aplicaciones en reconocimiento de lengua de señas es
dc.title.alternative Image generation using machine learning. Applied to sign language recognition en
dc.type Articulo es
sedici.identifier.uri https://revistas.unlp.edu.ar/InvJov/article/view/15469 es
sedici.identifier.issn 2314-3991 es
sedici.creator.person Ríos, Gastón Gustavo es
sedici.creator.person Ronchetti, Franco es
sedici.creator.person Hasperué, Waldo es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Facultad de Ciencias Agrarias y Forestales es
sedici.subtype Comunicacion es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
sedici.relation.event Encuentro de Becaries de Posgrado de la UNLP (La Plata, 2022) es
sedici.description.peerReview peer-review es
sedici.relation.journalTitle Investigación Joven es
sedici.relation.journalVolumeAndIssue vol. 10, no. 3 es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)