Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2024-03-01T12:43:11Z
dc.date.available 2024-03-01T12:43:11Z
dc.date.issued 2023
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/163313
dc.description.abstract En este artículo se describen las herramientas desarrolladas para la investigación sobre técnicas de análisis de textos y minería de datos aplicando métodos y algoritmos de análisis de texto estructurado y no estructurado, estableciendo un conjunto de criterios y seleccionando la mejor alternativa en base a los mismos. En este contexto, se describen las herramientas desarrolladas que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y herramientas que utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje por computadora, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Este trabajo se encuentra enmarcado dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo el crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de word, pdf y txt. es
dc.language es es
dc.subject análisis de texto es
dc.subject extracción de información es
dc.subject corpus es
dc.subject machine learning es
dc.subject redes neuronales artificiales es
dc.subject lenguaje formal es
dc.subject lenguaje natural es
dc.subject lenguaje estructurado es
dc.subject lenguaje no estructurado es
dc.title Desarrollo de herramientas para generación de material de entrenamiento y análisis de textos estructurados es
dc.type Objeto de conferencia es
sedici.identifier.isbn 978-987-3724-66-4 es
sedici.identifier.isbn 978-987-3724-67-1 es
sedici.creator.person Cardenas, Marina E. es
sedici.creator.person Castillo, Julio J. es
sedici.creator.person Hernández, Nicolás es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Red de Universidades con Carreras en Informática es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
sedici.date.exposure 2023-04
sedici.relation.event XXV Workshop de Investigadores en Ciencias de la Computación (Junín, 13 y 14 de abril de 2023) es
sedici.description.peerReview peer-review es
sedici.relation.isRelatedWith https://sedici.unlp.edu.ar/handle/10915/162004 es
sedici.relation.isRelatedWith https://sedici.unlp.edu.ar/handle/10915/161620 es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)